Un’innovazione che sorprende
DeepSeek, un’azienda cinese che ha rapidamente guadagnato notorietà nel settore dell’intelligenza artificiale, ha recentemente lanciato Janus-Pro, una serie di modelli multimodali che si propongono di superare le prestazioni di DALL-E 3, il noto modello di OpenAI. Questi modelli sono ora disponibili per il download sulla piattaforma di sviluppo AI Hugging Face, rendendo accessibile una tecnologia all’avanguardia a sviluppatori e ricercatori.
Caratteristiche dei modelli Janus-Pro
I modelli Janus-Pro variano in dimensione da 1 a 7 miliardi di parametri, un fattore cruciale che influisce sulle loro capacità di risoluzione dei problemi. In generale, un numero maggiore di parametri è associato a prestazioni superiori, e DeepSeek non fa eccezione. La licenza MIT che accompagna Janus-Pro consente un utilizzo commerciale senza restrizioni, aprendo la strada a numerose applicazioni nel mondo reale.
Prestazioni superiori rispetto alla concorrenza
Secondo le affermazioni di DeepSeek, il modello più grande, Janus-Pro-7B, ha superato DALL-E 3 e altri modelli come PixArt-alpha, Emu3-Gen e Stable Diffusion XL di Stability AI in due benchmark di valutazione dell’intelligenza artificiale: GenEval e DPG-Bench. Nonostante alcuni di questi modelli siano considerati obsoleti, le prestazioni di Janus-Pro rimangono impressionanti, soprattutto se si considera la loro dimensione compatta.
Un successo travolgente
DeepSeek, sostenuta dalla società di trading quantitativo High-Flyer Capital Management, sta attirando l’attenzione della Silicon Valley. Il suo modello R1 ha dimostrato di superare le capacità di OpenAI o1, e attualmente, l’app di DeepSeek è la più scaricata su Apple Store, superando anche ChatGPT.
Questo successo ha sollevato interrogativi tra analisti di Wall Street e esperti tecnologici riguardo alla capacità degli Stati Uniti di mantenere il primato nella corsa all’intelligenza artificiale e alla sostenibilità della domanda di chip per l’AI.