Opóźnienie R2 DeepSeek z powodu przejścia na chip Huawei Ascend do treningu? Współpraca inżynierów DS + HW nad migracją z CUDA do CANN jest ostatecznie pozytywna dla HW w dłuższej perspektywie. Wydanie R2 pierwotnie planowano na maj zeszłego roku. Od tego czasu przynajmniej jeden model SOTA z Chin został wydany, który był w pełni trenowany na sprzęcie HW. FT: Chińska firma zajmująca się sztuczną inteligencją DeepSeek opóźniła wydanie swojego nowego modelu po nieudanym treningu przy użyciu chipów Huawei, co podkreśla ograniczenia chińskiego dążenia do zastąpienia technologii amerykańskiej. DeepSeek został zachęcony przez władze do przyjęcia procesora Ascend firmy Huawei zamiast korzystania z systemów Nvidii po wydaniu modelu R1 w styczniu, według trzech osób zaznajomionych z tą sprawą. Jednak chińska start-up napotkała uporczywe problemy techniczne podczas procesu treningowego R2 przy użyciu chipów Ascend, co zmusiło ją do użycia chipów Nvidii do treningu, a chipów Huawei do wnioskowania, powiedziały te osoby. ... Huawei wysłał zespół inżynierów do biura DeepSeek, aby pomóc firmie w wykorzystaniu swojego chipa AI do opracowania modelu R2, według dwóch osób. Mimo obecności zespołu na miejscu, DeepSeek nie był w stanie przeprowadzić udanego treningu na chipie Ascend, powiedziały te osoby. DeepSeek nadal współpracuje z Huawei, aby dostosować model do Ascend do wnioskowania, dodały te osoby. ... Wydanie R2 zostało również opóźnione z powodu dłuższego niż oczekiwano czasu etykietowania danych dla zaktualizowanego modelu, dodała inna osoba. Chińskie media sugerowały, że model może zostać wydany już w nadchodzących tygodniach.
15,83K