DeepSeek R2 viivästyy Huawei Ascend -siruun siirtymisen vuoksi harjoittelua varten? DS + HW:n insinöörien yhteistyö CUDA:sta CANN:iin siirtymisessä on viime kädessä positiivista HW:lle pitkällä aikavälillä. R2:n julkaisua odotettiin alun perin viime toukokuussa. Sen jälkeen on julkaistu ainakin yksi kiinalainen SOTA-malli, joka on koulutettu kokonaan HW-laitteistolla. FT: Kiinalainen tekoälyyritys DeepSeek lykkäsi uuden mallinsa julkaisua epäonnistuttuaan kouluttamaan sitä Huawein siruilla, mikä korostaa Pekingin pyrkimyksen rajoja korvata yhdysvaltalainen teknologia. Viranomaiset kannustivat DeepSeekiä ottamaan käyttöön Huawein Ascend-prosessorin Nvidian järjestelmien käytön sijaan sen jälkeen, kun se julkaisi R1-mallinsa tammikuussa, kolmen asiaan perehtyneen henkilön mukaan. Mutta kiinalainen startup-yritys kohtasi jatkuvia teknisiä ongelmia R2-koulutusprosessissaan Ascend-sirujen avulla, mikä sai sen käyttämään Nvidia-siruja koulutukseen ja Huawein päättelyyn, ihmiset sanoivat. ... Kahden henkilön mukaan Huawei lähetti insinööreryhmän DeepSeekin toimistoon auttamaan yritystä käyttämään tekoälysiruaan R2-mallin kehittämiseen. Vaikka tiimi oli paikalla, DeepSeek ei kuitenkaan pystynyt suorittamaan onnistunutta harjoitusta Ascend-sirulla, ihmiset sanoivat. DeepSeek työskentelee edelleen Huawein kanssa tehdäkseen mallista yhteensopivan Ascendin kanssa päättelyä varten, ihmiset sanoivat. ... R2:n lanseeraus viivästyi myös sen päivitetyn mallin odotettua pidemmän tietomerkinnän vuoksi, toinen henkilö lisäsi. Kiinalaiset tiedotusvälineet ovat ehdottaneet, että malli saatetaan julkaista jo lähiviikkoina.
15,92K