OpenAI o1, modelul lingvistic recent prezentat pentru raționamente complexe, are deja concurență. Iată DeepSeek R1-Lite-Preview, o primă imagine a unei inteligențe artificiale care își ia timp să gândească și să își explice raționamentul.
Deși principalele companii de inteligență artificială au sediul în Statele Unite și Europa, China vine rapid din urmă. DeepSeek din China atrage din ce în ce mai mult atenția pentru modelele sale lingvistice la scară largă, publicate sub o licență deschisă și capabile să rivalizeze cu cele ale OpenAI.
După DeepSeek-V2.5 publicat în septembrie, care a depășit GPT-4, și DeepSeek Coder V2 prezentat în iunie, care a depășit GPT-4 Turbo pentru matematică și programare, iată DeepSeek R1-Lite-Preview. Aceasta este o primă evaluare a acestui nou model care, la fel ca OpenAI o1, este specializat în raționamente complexe. Și, potrivit DeepSeek, reușește să bată modelul OpenAI la mai multe capitole.
Un model de raționament complex
Caracteristica specială a acestui model este că face explicit lanțul său de gândire (CoT), permițându-vă să urmăriți diferitele etape ale raționamentului său. Și nu se grăbește. Chatbotul indică timpul petrecut cu gândirea, care este adesea de aproximativ treizeci de secunde. Conform testelor efectuate de DeepSeek, R1-Lite-Preview este deosebit de bun la inferențe logice, raționament matematic și rezolvarea problemelor în timp real. Are chiar scoruri mai bune decât OpenAI o1 la testele de referință matematice AIME și MATH și scoruri foarte similare la programare, inclusiv Codeforces și LiveCodeBench.
DeepSeek poate fi testat gratuit pe site-ul său chat.deepseek.com, cu o limită de 50 de mesaje pe zi.
MM
Testând DeepSeek R1-Lite-Preview, am fost surprins de capacitatea sa de a răspunde cu claritate și profunzime la întrebări complexe, explicându-și raționamentul cu un nivel de detaliu rar întâlnit la alte modele. Această nouă direcție în evoluția inteligenței artificiale, unde transparența nu doar în rezultate, ci și în procesul de raționare devine normă, ar putea redefini modul în care interacționăm cu tehnologia, oferindu-ne nu doar răspunsuri, ci și o mai bună înțelegere a contextului. Capacitatea de a observa lanțul de gândire al AI-ului nu doar că îmbunătățește încrederea utilizatorului, dar ar putea inspira și practici similare în sfera educațională și profesională, promovând un mediu de învățare colaborativ și transparent. Într-o lume tot mai digitalizată, această abordare ar putea să ne amintească de importanța reflecției și a procesului gândirii, un aspect esențial nu doar pentru AI, dar și pentru propria noastră dezvoltare personală și profesională.