Озмоиши "Зирактарин дар ҷаҳон" Grok3

ГУРУХИ ВАТОНИ AIPU (1)

Муқаддима

Ба фикри шумо, Grok3 "нуқтаи ниҳоӣ" -и моделҳои қаблан омӯзонидашуда хоҳад буд?

Элон Маск ва дастаи xAI расман версияи охирини Grok, Grok3-ро ҳангоми пахши мустақим оғоз карданд. Қабл аз ин чорабинӣ, миқдори зиёди иттилооти марбута, дар якҷоягӣ бо таблиғоти таблиғотии 24/7 Маск, интизориҳои ҷаҳонии Grok3-ро ба сатҳи бесобиқа боло бурданд. Ҳамагӣ як ҳафта пеш, Маск ҳангоми пахши мустақим ҳангоми шарҳи DeepSeek R1 бо итминон изҳор дошт, ки "xAI модели беҳтари AI-ро ба кор андохтааст." Тибқи гузоришҳо, Grok3 аз ҳама моделҳои ҷорӣ дар меъёрҳои риёзӣ, илм ва барномасозӣ болотар рафтааст ва Маск ҳатто иддао кардааст, ки Grok3 барои вазифаҳои ҳисоббарории марбут ба миссияҳои SpaceX дар Миррих истифода мешавад ва пешгӯӣ мекунад, ки "пешрафтҳо дар сатҳи Ҷоизаи Нобел дар тӯли се сол." Аммо, инҳо ҳоло танҳо изҳороти Маск мебошанд. Пас аз оғози кор, ман версияи охирини бета-и Grok3-ро санҷидам ва барои моделҳои калон саволи классикиро пешниҳод кардам: "Кадомаш калонтар аст, 9.11 ё 9.9?" Мутаассифона, бе ягон квалификатор ё нишондод, ба истилоҳ донотарин Grok3 то ҳол ба ин савол дуруст ҷавоб дода натавонист. Грок3 маънои саволро дуруст муайян карда натавонист.

 

Ин озмоиш ба зудӣ таваҷҷӯҳи зиёди дӯстони зиёдеро ба худ ҷалб кард ва тасодуфан, озмоишҳои шабеҳ дар хориҷа нишон доданд, ки Grok3 бо саволҳои асосии физика/математика мубориза мебарад, ба монанди "Кадом тӯб аз бурҷи такягоҳи Пиза аввал меафтад?" Ҳамин тариқ, он ба таври ҳаҷвӣ ҳамчун "нобиғае, ки намехоҳад ба саволҳои оддӣ ҷавоб диҳад" номгузорӣ шудааст.

640

Grok3 хуб аст, аммо он аз R1 ё o1-Pro беҳтар нест.

Grok3 дар бисёр санҷишҳои дониши умумӣ дар амал "нокомиҳо" -ро аз сар гузаронидааст. Дар ҷараёни маросими ифтитоҳи xAI, Маск бо истифода аз Grok3 барои таҳлили синфҳо ва эффектҳои бозии Path of Exile 2, ки иддао дошт, ки онро аксар вақт бозӣ мекунад, нишон дод, аммо аксари ҷавобҳои аз ҷониби Grok3 пешниҳодшуда нодуруст буданд. Маск ҳангоми пахши мустақим ин масъалаи равшанро пай набурд.

 

Ин иштибоҳ на танҳо далелҳои иловагиро барои шабакаҳои хориҷӣ барои масхара кардани Маск барои "пайдо кардани ҷойнишин" дар бозӣ фароҳам овард, балки нигарониҳои ҷиддиро дар мавриди эътимоднокии Grok3 дар барномаҳои амалӣ ба миён овард. Барои чунин «гениал», сарфи назар аз имкониятҳои воқеии худ, эътимоднокии он дар сенарияҳои ниҳоят мураккаби татбиқ, ба монанди вазифаҳои иктишофии Миррих, зери шубҳа боқӣ мемонад.

 

Дар айни замон, бисёре аз озмоишгароне, ки ҳафтаҳои пеш ба Grok3 дастрасӣ пайдо кардаанд ва онҳое, ки дирӯз қобилияти моделро чанд соат санҷидаанд, ҳама ба як хулосаи умумӣ ишора мекунанд: "Grok3 хуб аст, аммо он беҳтар аз R1 ё o1-Pro нест."

640 (1)

Дурнамои интиқодӣ дар бораи "вайрон кардани Nvidia"

Дар PPT расман пешниҳодшуда ҳангоми нашр, Grok3 дар Chatbot Arena "хеле пештар" буд, аммо ин усулҳои графикиро оқилона истифода бурд: меҳвари амудӣ дар тахтаи пешсаф танҳо натиҷаҳоро дар диапазони холҳои 1400-1300 номбар кардааст, ки фарқияти аслии 1% дар натиҷаҳои санҷиш дар ин презентатсия хеле муҳим аст.

640

Дар натиҷаҳои воқеии баҳодиҳии модел, Grok3 аз DeepSeek R1 ва GPT-4.0 ҳамагӣ 1-2% пештар аст, ки ба таҷрибаи бисёре аз корбарон дар санҷишҳои амалӣ, ки "фарқияти назаррас" наёфтанд, мувофиқат мекунад. Grok3 аз ворисони худ танҳо 1%-2% зиёдтар аст.

640

Гарчанде ки Grok3 нисбат ба ҳама моделҳои дар айни замон санҷидашуда холҳои баландтар гирифтааст, бисёриҳо инро ҷиддӣ қабул намекунанд: дар ниҳоят, xAI қаблан барои "манипуляцияи холҳо" дар давраи Grok2 танқид шуда буд. Вақте ки ҷадвали пешсаф сабки дарозии ҷавобро ҷазо дод, холҳо хеле кам шуданд ва инсайдерони соҳаро водор карданд, ки падидаи "баҳои баланд, вале қобилияти паст" -ро танқид кунанд.

 

Новобаста аз он ки тавассути "манипуляция" дар панели пешсаф ё ҳилаҳои тарроҳӣ дар тасвирҳо, онҳо васвоси xAI ва Маскро бо мафҳуми "пешбарии баста" дар қобилиятҳои модел ошкор мекунанд. Маск барои ин маржаҳо нархи гарон пардохт кард: ҳангоми оғозёбӣ ӯ аз истифодаи 200,000 H100 GPU (дар ҷараёни пахши мустақим "зиёда аз 100,000" даъво дорад) ва расидан ба вақти умумии омӯзиш 200 миллион соат фахр кард. Ин ба баъзеҳо водор кард, ки он як неъмати дигари назаррасро барои саноати GPU муаррифӣ мекунад ва таъсири DeepSeek ба бахшро "беақл" мешуморанд. Қобили зикр аст, ки баъзеҳо боварӣ доранд, ки қудрати ҳисоббарорӣ ояндаи омӯзиши моделӣ хоҳад буд.

 

Бо вуҷуди ин, баъзе шабакаҳо истеъмоли 2000 GPU-и H800-ро дар тӯли ду моҳ барои тавлиди DeepSeek V3 муқоиса карданд ва ҳисоб карданд, ки масрафи нерӯи воқеии омӯзиши Grok3 аз V3 263 маротиба зиёдтар аст. Фарқият байни DeepSeek V3, ки 1402 хол гирифтааст ва Grok3 каме камтар аз 100 хол аст. Пас аз интишори ин маълумот, бисёриҳо зуд дарк карданд, ки дар паси унвони Grok3 ҳамчун "қавитарин дар ҷаҳон" як эффекти возеҳи фоиданок аст - мантиқи моделҳои калонтаре, ки иҷрои қавитар тавлид мекунанд, даромади коҳишро нишон медиҳад.

640 (2)

Ҳатто бо "баҳои баланд, вале қобилияти паст", Grok2 миқдори зиёди маълумоти босифати аввалро аз платформаи X (Twitter) барои дастгирии истифода дошт. Бо вуҷуди ин, дар омӯзиши Grok3, xAI табиатан бо "шифт" дучор шуд, ки OpenAI ҳоло рӯ ба рӯ мешавад - набудани маълумоти олӣ барои омӯзиш фоидаи ночизи қобилиятҳои моделро зуд фош мекунад.

 

Таҳиягарони Grok3 ва Musk эҳтимолан аввалин шуда ин далелҳоро амиқ дарк мекунанд ва муайян мекунанд, аз ин рӯ Маск пайваста дар шабакаҳои иҷтимоӣ қайд мекунад, ки версияи корбарон ҳоло "ҳанӯз танҳо бета" аст ва "версияи пурраи он дар моҳҳои оянда нашр хоҳад шуд." Маск нақши менеҷери маҳсулоти Grok3-ро ба ӯҳда гирифт ва ба корбарон пешниҳод кард, ки дар бораи масъалаҳои мухталифе, ки дар қисмати шарҳҳо дучор мешаванд, фикру мулоҳизаҳои худро пешниҳод кунанд. Вай шояд мудири бештари маҳсулот дар рӯи замин бошад.

 

Бо вуҷуди ин, дар давоми як рӯз, иҷрои Grok3 бешубҳа барои онҳое, ки ба "мушакҳои азими ҳисоббарорӣ" такя мекунанд, то моделҳои қавитари калонро омода кунанд, ҳушдор дод: бар асоси маълумоти дастраси Microsoft, GPT-4-и OpenAI дорои андозаи параметри 1,8 триллион параметр аст, ки аз GPT-3 даҳ маротиба зиёдтар аст. Овозаҳо нишон медиҳанд, ки андозаи параметри GPT-4.5 метавонад ҳатто калонтар бошад.

 

Вақте ки андозаи параметрҳои модел афзоиш меёбад, хароҷоти омӯзиш низ ба таври фаврӣ меафзояд. Бо ҳузури Grok3, рақибон ба монанди GPT-4.5 ва дигарон, ки мехоҳанд "сухтани пул" -ро идома диҳанд, то иҷрои беҳтари моделро тавассути андозаи параметр ба даст оранд, бояд шифтеро, ки ҳоло ба таври равшан дар назар аст, баррасӣ кунанд ва дар бораи чӣ гуна бартараф кардани он фикр кунанд. Дар айни замон, Иля Сутскевер, собиқ сармуҳосиби OpenAI, қаблан моҳи декабри соли гузашта изҳор карда буд, "Тренинги пеш аз мо, ки бо он шинос ҳастем, ба охир мерасад", ки дар баҳсҳо дубора пайдо шуд ва ба талошҳо барои дарёфти роҳи воқеии омӯзиши моделҳои калон сабаб шуд.

640 (3)

Нуктаи назари Илья дар саноат бонги изтироб зад. Вай ба таври дақиқ тамом шудани маълумоти нави дастрасро пешгӯӣ карда буд, ки ба вазъияте оварда мерасонад, ки иҷрои онро тавассути ба даст овардани маълумот идома додан мумкин нест ва онро ба тамомшавии сӯзишвории истихроҷшаванда монанд мекунад. Вай қайд кард, ки "ба монанди нафт, мундариҷаи аз ҷониби инсон тавлидшуда дар интернет як манбаи маҳдуд аст." Тибқи пешгӯиҳои Сутскевер, насли ояндаи моделҳо, пас аз омӯзиши пешакӣ, дорои "мухтори ҳақиқӣ" ва қобилиятҳои "монанди майнаи инсон" хоҳанд буд.

 

Баръакси моделҳои қаблан омӯзонидашудаи имрӯза, ки пеш аз ҳама ба мутобиқати мундариҷа такя мекунанд (дар асоси мундариҷаи модели қаблан омӯхташуда), системаҳои ояндаи AI метавонанд методологияҳои ҳалли мушкилотро ба таври шабеҳ ба “фикр”-и майнаи инсон омӯхта ва таъсис диҳанд. Одам метавонад дар як мавзӯъ танҳо бо адабиёти оддии касбӣ маҳорати бунёдӣ ба даст орад, дар ҳоле ки модели бузурги AI барои ноил шудан ба самаранокии оддии сатҳи ибтидоӣ миллионҳо нуқтаи маълумотро талаб мекунад. Ҳатто вақте ки матн каме тағир дода мешавад, ин саволҳои асосӣ метавонанд дуруст нафаҳманд, ки ин нишон медиҳад, ки модел дар интеллектуалӣ воқеан такмил наёфтааст: саволҳои асосӣ, вале ҳалнашаванда, ки дар аввали мақола зикр шудаанд, мисоли равшани ин падида мебошанд.

微信图片_20240614024031.jpg1

Хулоса

Бо вуҷуди ин, берун аз қувваи бераҳмона, агар Grok3 воқеан муваффақ шавад, ки ба саноат ошкор кунад, ки "моделҳои қаблан омӯзонидашуда ба анҷоми худ наздик мешаванд", ин барои ин соҳа оқибатҳои назаррас хоҳад дошт.

Шояд пас аз он ки девонавор дар атрофи Grok3 тадриҷан коҳиш ёбад, мо шоҳиди ҳолатҳои бештаре ба монанди мисоли Фей-Фей Ли дар бораи "танзим кардани моделҳои баландсифат дар маҷмӯаи додаҳои мушаххас ҳамагӣ 50 доллар" хоҳем шуд ва дар ниҳоят роҳи ҳақиқиро ба AGI кашф мекунем.

Ҷустуҷӯи ҳалли кабели ELV

Кабелҳои назоратӣ

Барои BMS, BUS, саноатӣ, кабели асбобҳо.

Системаи кабелии сохторӣ

Шабака ва маълумот, Кабели нахи оптикӣ, Корд дарбеҳ, Модулҳо, Faceplate

Баррасии намоишгоҳҳо ва рӯйдодҳо 2024

16-18 апрели соли 2024 Энергияи Шарқи Наздик дар Дубай

16-18 апрели соли 2024 Секурика дар Маскав

9 майи соли 2024 Чорабинии Ифтитоҳи маҳсулоти нав ва технологияҳо дар Шанхай

22-25 октябри соли 2024 CECURITY CHINA дар Пекин

Ноя 19-20, 2024 ҶАҲОНИ ПАЙВАНД КСА


Вақти фиристодан: феврал-19-2025