Toată lumea foloseşte inteligenţa artificială generativă pentru a afla diverse informaţii şi, din păcate, acestea sunt luate drept surse 100% veridice, deşi nu de puţine ori s-a dovedit că unele date sunt scoase din context, exagerate sau chiar inventate.
Cei de la euronews.ro au avut o iniţiativă foarte interesantă şi au pus ChatGPT şi Claude să rezolve subiectele de la Bac de la Limba Română, cele de la profilul uman (să fie puţin mai dificil). După aceea, rezolvarea a fost corectată de un profesor de limba şi literatura română.
Conform acestui experiment, atât ChatGPT, cât şi Claude, au luat nota 8.9. Evaluarea sugerează că ambele modele se descurcă foarte bine la sarcinile de analiză şi redactare, însă pe alocuri mai au nevoie de îmbunătăţiri. Dacă ChatGPT a fost mai pragmatic la al treilea subiect, Claude a fost mai creativ şi a ales cu atenţie versurile pe care să le analizeze. Ambele modele au pierdut puncte multe la textul argumentativ, unde nu au respectat în totalitate cerinţele.
Intrigant mi se pare că acelaşi experiment a fost realizat şi în 2023, iar atunci ChatGPT a luat nota 7.3. La viteza cu care evoluează sistemele de inteligenţă artificială, bănuiesc că în 2027 vom vedea primul 10 curat la Bac al unui model AI de bază.