általános

A Microsoft kis nyelvi modelleken dolgozik

A Microsoft kis nyelvi modellek létrehozásán dolgozik, és úgy gondolja, hogy ezek nem lehetnek kevesebbek

hatékonyabb, mint a nagy nyelvi modellek.Például a cég bemutatta a Phi 1 nyelvi modellt, amely 1,3 milliárd paraméterrel rendelkezik, míg a modell összehasonlító tesztjei nagyobb pontosságot mutattak, meghaladva a 175 milliárd paraméterrel rendelkező GPT 3,5 teljesítményét. A Phi 1 modell a Transformer architektúrára épül, és 4 napig képezték speciálisan kiválasztott adatokon. A fejlesztők úgy vélik, hogy eredményes munkáját annak köszönhették, hogy jó minőségű adatkészletet használtak a képzéshez. A modell 8 Nvidia A100 GPU-t használt, és négy napig tartott a betanítás. A modell nyílt forráskódon alapul, és a Microsoft elkötelezettségét mutatja a mesterséges intelligencia fejlesztése iránt.