„Európa vezető MI-vállalatai és kutatóintézetei egyesítik erejüket és szakértelmüket, hogy az OpenEuroLLM projektben, az európai MI-képességek fejlesztésére irányuló példátlan együttműködés keretében új generációs nyílt forráskódú nyelvi modelleket fejlesszenek ki.
A konzorciumot Jan Hajič (Károly Egyetem, Csehország) koordinálja, a vezetésben társa Peter Sarlin (AMD Silo AI, Finnország). A 20 vezető európai kutatóintézetből, vállalatból és EuroHPC-központból álló konzorcium a kereskedelmi, ipari és közszolgáltatások számára nagy teljesítményű, többnyelvű, nagy nyelvi alapmodellek családját fogja létrehozni.
Az átlátható és kompatibilis, nyílt forráskódú modellek demokratizálják a magas színvonalú mesterséges intelligencia technológiákhoz való hozzáférést, és erősítik az európai vállalatok versenyképességét a globális piacon, valamint az állami szervezetek képességét a hatásos közszolgáltatások előállítására.
Az OpenEuroLLM projekt összhangban van az európai versenyképesség és digitális szuverenitás javításának szükségszerűségével. A projekt kiváló példája annak a fajta technológiai infrastruktúrának, amely lehetővé teszi, hogy könnyebben megvalósítható legyen az európai mesterséges intelligencia-termékfejlesztés és -finomítás. Mindez az átláthatóság, a nyitottság és a közösségi részvétel – az európai technológiai ökoszisztémában széles körben elismert értékek – erejét mutatja.
A modelleket Európa szilárd szabályozási keretein belül fejlesztik ki, biztosítva az európai értékekhez való igazodást, miközben a technológiai kiválóságot is fenntartják. A nyílt forráskódú és nyílt tudományos közösségekkel, mint például a LAION, az open-sci és az OpenML, valamint a projekt nyílt stratégiai partnerségi tanácsában összegyűlt további szakértőkkel együttműködve az OpenEuroLLM biztosítja, hogy a modellek, a szoftverek, az adatok és az értékelés teljes mértékben nyíltak legyenek, és hogy a modellek az iparág és a közszféra egyedi igényeihez igazodva finomhangolhatók és utasításokkal kiegészíthetők legyenek. Ezek a hatékony, többnyelvű modellek megőrzik mind a nyelvi, mind a kulturális sokszínűséget, lehetővé téve az európai vállalatok számára, hogy a mesterséges intelligencia korában magas színvonalú termékeket és szolgáltatásokat fejlesszenek ki.
A projekt, amely elnyerte a STEP (Strategic Technologies for Europe Platform) pecsétet, a korábbi európai projektek támogatását, valamint a partnerek tapasztalatait és eredményeit hasznosítja, beleértve a kiváló minőségű adatok nagy tárházait és a korábban kifejlesztett kísérleti LLM-eket. A konzorcium 2025. február 1-jén kezdi meg munkáját az Európai Bizottság Digitális Európa programjának finanszírozásával.
A partnerek teljes listája
Egyetemek és kutatási szervezetek:
- Charles University, Institute of Formal and Applied Linguistics, Csehország (koordinátor)
- Alliance for Language Technologies EDIC, (ALT-EDIC), Franciaország
- Eindhoven University of Technology, Hollandia
- ELLIS Institute Tübingen, Németország
- Fraunhofer IAIS, Németország
- Research Center Juelich, Németország
- Lindholmen Science Park, (AI Sweden), Svédország
- University of Helsinki, Finnország
- University of Oslo, Norvégia
- University of Turku, Finnország
- University of Tübingen, (Tübingen AI Center), Németország
Vállalatok:
- Silo GenAI, (AMD Silo AI), Finnország (társvezető)
- Aleph Alpha Research, Németország
- ellamind, Németország
- LightOn, France
- Prompsit Language Engineering, Spanyolország
EuroHPC központok:
- Barcelona Supercomputing Center, Spanyolország
- Cineca Interuniversity Consortium, Olaszország
- CSC – IT Center for Science, Finnország
- SURF, Hollandia
Kapcsolat: Jan Hajič, hajic@ufal.mff.cuni.cz, +420 607 209 212
Forrás:
Open LLMs for Transparent AI in Europe; OpenEuroLLM; 2025. február 3.