Зерттеу: Жасанды интеллект чат-боттары қиын жағдайларды бағалауда адамдардан асып түсті

On Дек 5, 2024

Scientific Reports журналында жарияланған жаңа зерттеу кейбір жетілдірілген AI чат-боттары күрделі әлеуметтік жағдайларда тиімді шешім қабылдауда адамдардан гөрі жақсы нәтиже көрсеткенін анықтады.

Зерттеушілер Situational Judgment Test деп аталатын танымал психологиялық құралды пайдаланып, үш чат-боттың – Claude, Microsoft Copilot және you.com-ның ақылды көмекшісі – ең тиімді мінез-құлық жауаптарын таңдау бойынша адамдардан асып түскенін байқады.

Зерттеушілер бұл нәтижелер жасанды интеллекттің клиенттерге қызмет көрсету мен психологиялық қолдау сияқты әлеуметтік қарым-қатынастарды басқарудағы маңыздылығын арттыратынын атап өтті. Үлкен тіл модельдері, соның ішінде бұл зерттеуде тексерілген чат-боттар, тілдерді өңдеу, контекстті түсіну және пайдаланушыларға көмектесетін жауаптар ұсыну үшін жасалған. Бұрынғы зерттеулер олардың академиялық және тілдік тапсырмаларды орындаудағы қабілетін көрсеткенімен, күрделі әлеуметтік динамикаға бейімделу мүмкіндіктері әлі терең зерттелмеген еді.

Зерттеуге сәйкес, Situational Judgment Test чат-боттардың әлеуетін тексеруге пайдаланылды. Бұл тест әлеуметтік құзыреттілікті бағалауға арналған және психология мен кадрлық іріктеу саласында кеңінен қолданылады. Тестте 12 жағдай ұсынылып, қатысушылардан төрт ықтимал әрекеттің ең жақсы және ең нашар нұсқасын анықтау сұралды. Әр сценарий бойынша жауаптарды 109 адамнан тұратын сарапшылар тобы бағалады.

Зерттеу бес AI чат-боттың – Claude, Microsoft Copilot, ChatGPT, Google Gemini және you.com-ның ақылды көмекшісінің – көрсеткіштерін 276 адамнан тұратын топпен салыстырды. Адамдар тобы жоғары білімі мен мотивациясы үшін іріктелген ұшқыш үміткерлерден тұрды, бұл AI үшін қатаң өлшем болды.

Чат-боттардың әрқайсысы тестті он реттен өтіп, нәтижелердің тұрақтылығын қамтамасыз ету үшін сценарийлер кездейсоқ тәртіпте ұсынылды. Нәтижелер сарапшылар анықтаған ең жақсы және нашар жауаптармен қаншалықты сәйкес келетініне қарай бағаланды.

«Бұл зерттеу үлкен тіл модельдерінің Батыс мәдениетіне тән әлеуметтік бағалауларға сәйкес келетінін көрсетеді. Дегенмен, басқа мәдени контексттерде олардың көрсеткіштерін зерттеу қызық болар еді» – деді зерттеу авторы Джастин М. Миттельштедт. «Үлкен тіл модельдері эмоцияларға ие болмаса да, олар әлеуметтік қарым-қатынас дағдыларын дамытуға көмекші құрал ретінде болашағы зор».

Бұл зерттеу «Үлкен тіл модельдері әлеуметтік жағдайларды бағалауда адамдардан асып түсе алады» деп аталады және оны Джастин М. Миттельштедт, Джулия Майер, Паня Гёрке, Франк Цинн және Майкл Хермес авторлық етті.

turkystan.kz