SINGAPORE, Okt. 1, 2023 — Kamakailan, ginawa ng Colossal-AI ang isang kamangha-manghang domain-specific na malaking modelo ng wika (LLM) sa pamamagitan lamang ng ilang daang dolyar na gastos sa pagsasanay. Ito ay madaling maaaring ilapat sa iba’t ibang mga domain, na nagpapadali sa ekonomikal na pagbuo ng malalaking modelo ng AI.

Ang solusyon ay madaling ma-access nang walang anumang mga paghihigpit sa komersyal, na may kumpletong transparency na ibinigay sa buong proseso ng pagsasanay, code, at mga timbang ng modelo.

Mga detalye ng teknikal, open-source na code at mga timbang ay available sa: https://github.com/hpcaitech/ColossalAI

Bridging from any general large models to any domain-specific large models with only a few hundred dollars.
Pagbuo mula sa anumang pangkalahatang malalaking mga modelo patungo sa anumang domain-specific na malalaking mga modelo na may ilang daang dolyar lamang.

Pagganap

Ang modelo ng Colossal-AI ay hindi lamang pumapayabong sa mga kakayahan sa wikang Tsino kundi patuloy ding pinapahusay ang kahusayan nito sa Ingles. Napakatanyag, ipinapakita nito ang mga antas ng pagganap na katumbas ng state-of-the-art (SOTA) na mga modelo ng katulad na sukat sa loob ng open-source na komunidad.

Kasabay nito, nag-aalok ang Colossal-AI ng komprehensibong balangkas ng pagsusuri, ColossalEval, na nagpapadali sa cost-effective na pagkakataong muling gawin.

Bilang karagdagan, may mga limitasyon ang fine-tuning sa pamamagitan ng mga pamamaraan tulad ng SFT at LoRA sa epektibong pagsasalin ng kaalaman at mga kakayahan mula sa base model. Hindi ito nangangasiwa nang maayos sa mga kinakailangan para sa pagtatayo ng mataas na kalidad na domain-specific na kaalaman o mga espesyalisadong application ng modelo.

Pagbuo mula sa Pangkalahatang Malalaking Mga Modelo Patungo sa Mga Malalaking Modelo ng Domain-specific

Higit sa lahat, ang paglikha ng isang bersyon sa wikang Tsino ay hindi lamang nag-aalok ng pakinabang ng muling paggamit kundi may malaking kahalagahan din sa mga senaryo ng implementasyon sa totoong mundo.

Malawakang kinikilala na napakalaki ng gastos sa pre-training ng malalaking modelo ng AI mula sa simula, madalas na nakakatawang tinutukoy bilang isang domain na accessible lamang sa mga may “50 milyong dolyar” na sobra.

Maraming mga higanteng tech at mga startup ng AI ang gustong mamuhunan nang malaki sa pagbuo ng malalaking pangkalahatang mga modelo. Gayunpaman, sa likod ng pangkalahatan ng mga malalaking modelo na ito ay madalas ang kakulangan ng domain-specific na kaalaman. Bilang resulta, ang isyu ng praktikal na pagiging applicable ay partikular na seryoso.

Kung ang isang malaking modelo ng domain-specific ay maaaring mabilis at cost-effectively na itayo, sinundan ng fine-tuning para sa mga partikular na pangangailangan sa negosyo, ito ay walang-alinlangang maiuuna ang pagde-deploy ng mga application, na nagbibigay ng competitive advantage.

Ang pag-apply ng nabanggit na proseso upang gawin ang paglipat ng kaalaman sa anumang larangan ay nagpapahintulot sa cost-effective na konstruksyon ng lightweight na mga pundasyonal na malalaking modelo ng domain-specific.

Para sa pagtatayo ng mga pundasyonal na malalaking modelo mula sa simula, maaari ring kumuha ng inspirasyon mula sa nabanggit na mga karanasan at mga kakayahan ng Colossal-AI sa pagbawas ng gastos at pagganda ng kahusayan upang maabot nang epektibo ang layuning ito sa pinakamababang gastos.

Optimisasyon ng System ng Colossal-AI at Cloud Platform

Ang kamangha-manghang pagganap at mga advantage sa gastos ay nabuo sa ibabaw ng pundasyon ng mababang gastos na sistema ng pag-develop ng malaking modelo ng AI, Colossal-AI.

Ginagamit ng Colossal-AI ang mga epektibong teknik upang mabawasan ang mga gastos sa pagsasanay, fine-tuning, at inference ng malalaking modelo ng AI. Nakipagtulungan ito sa maraming kumpanya ng Fortune 500 at iba pang kilalang mga enterprise.

Upang lalo pang pahusayin ang kahusayan ng pag-develop at pagde-deploy ng malalaking modelo, na-upgrade ang Colossal-AI sa cloud platform ng Colossal-AI, na ngayon ay nasa public beta, at ang pagrehistro ay magbibigay sa iyo ng mga voucher.

Colossal-AI Cloud Platform: platform.colossalai.com

Address ng Open Source ng Colossal-AI: https://github.com/hpcaitech/ColossalAI

Tungkol sa HPC-AI Tech

Ang HPC-AI Tech ay isang startup na nakabase sa Singapore. Ang kanilang pangunahing produkto, Colossal-AI, ay isang versatile na system ng malalim na pagkatuto na dinisenyo para sa panahon ng malalaking modelo ng AI. Pinapayagan nito ang mahusay at mabilis na pagde-deploy ng pagsasanay at inference ng malalaking modelo ng AI, na nagreresulta sa significant na pagbawas ng gastos para sa mga application ng malalaking modelo ng AI. Nagtaas ng pondo ang HPC-AI Tech ng 22 milyong USD sa Series A Funding noong Hulyo 2023.

Para sa mga pagtatanong ng media o karagdagang impormasyon, mangyaring makipag-ugnay sa:

contact@hpc-ai.tech