AI – Umjetna inteligencija, Blog, Tehnologije

IBM izaziva budućnost umjetnog zaključivanja

Objavljeno

17/02/2025

Oznake

, , ,

Najnovija pomama u umjetnoj inteligenciji povezana je s modelima ‘zaključivanja’, velikim jezičnim modelima (Large Language Models-LLM) koji su prilagođeni da ‘razmišljaju’ dulje prije nego što odgovore na upite. Osnova ovoga – prikazana u OpenAI-jevoj o-seriji i DeepSeek-ovom R1 – uključuje razmišljanje lanca misli , Chain-of Thought (CoT), stariji pristup koji je, u kombinaciji s najnovijim LLM-ovima, imao prilično snažan učinak.
Prvi put naglašen u radu istraživača Google DeepMind iz 2022., CoT je započeo kao tehnika poticanja koja se nedavno razvila u pristup koji je ugrađen u same modele.

Ian Krietzberg iz The deep view i Dr. David Cox iz IBM donose više detalja :

• “Uglavnom, netko je shvatio da ako kažete, ‘recite modelu (da) razmišlja korak po korak’, to zapravo daje bolje rezultate”, rekao je dr. David Cox, potpredsjednik AI modela u IBM Research.
• “Modelu će zapravo trebati vremena. Verbalizirat će nekoliko koraka i na kraju ćete dobiti bolji rezultat. A to je vrlo svestrana stvar. Ali ako samo to radite, onda to ima svoje granice”, rekao je. “Pomaže. Ali to ne mijenja život.”

I dok se industrija već mjesecima kreće u smjeru ‘zaključivanja’, došlo je do definitivnog pomaka nakon DeepSeek-ovog izdanja R1, naizgled jeftinijeg modela koji je postigao paritet s OpenAI-jevim modelima kroz učenje pojačanja i CoT rezoniranje.
“Svi su imali stvarno, stvarno snažnu reakciju na izlazak R1, što nas je iskreno malo zbunilo u polju istraživanja”, rekao je Cox, objašnjavajući da DeepSeek, barem za one u industriji, nije baš došao niotkuda. “Već smo bili uzbuđeni. Svi smo već radili na tome.” I umjesto da čeka da ga objavi, IBM je odlučio “samo izbaciti nešto da pokaže što smo radili u tom vremenu.”
Ranije ovog mjeseca, IBM je objavio izdanje za pregled verzije svog modela Granite 3.1 8B s omogućenim razmišljanjem, dijela IBM-ove obitelji manjih jezičnih modela dizajniranih za uparivanje sa skupovima podataka specifičnim za poduzeća.

  • Tamo gdje je DeepSeek iskoristio destilaciju modela kako bi postigao svoje rezultate, IBM je primijenio učenje pojačanja izravno na svoj model Granite kako bi potaknuo obrazloženje CoT-a, što osigurava “da su očuvane kritične karakteristike poput sigurnosti izvornog modela i opće performanse.”
  • Kao rezultat ovog pristupa, IBM je zabilježio dvoznamenkasti rast referentnih performansi koje su, posebice, dobro funkcionirale u širokom rasponu specifičnih zadataka bez žrtvovanja općih performansi.

Istraživači nisu primijetili nikakvu razliku u sigurnosnoj izvedbi između modela s omogućenim razmišljanjem i izvornih modela. To je značajan trenutak u sukobu i raspravi između velikih i malih jezičnih modela, gdje manji modeli nude veću učinkovitost, ali općenito manje robusnu izvedbu.
“Mislim da će to biti kontinuirani trend da zapravo možemo uzeti ove manje modele, koji su vrlo svestrani, vrlo brzi, vrlo učinkoviti, i onda ih praktički učiniti većim na zahtjev”, rekao je Cox. “Ideja da možete uzeti mali model i omogućiti mu da radi više stvari tako što ćete ga rasporediti u vremenu, to je nešto za što mislim da će se zavladati posvuda.”
I za razliku od trenda koji trenutno vidimo kod sustava – poput ChatGPT-a – koji se mogu prebacivati između rezonirajućih i nerezonirajućih modela prema potrebi, IBM je dizajnirao ovaj model tako da korisnici mogu u biti uključiti ili isključiti CoT – bez mijenjanja modela. Budući da je obrazloženje CoT-a i duže i skuplje od alternative, to nije uvijek potrebno (ili poželjno). Zbog toga je IBM-ov fokus bio na fleksibilnosti.
“Izrađujemo ovaj skup kontroliranih, programerima prilagođenih načina za dodavanje zastavica koje samo govore modelu što trebamo učiniti”, rekao je Cox.

Ovaj rad, prema Coxu, samo je početak dugoročnog trenda.

“Imamo još mnogo toga što se događa u prostoru razmišljanja, odvijaju se razne vrste rada na razmišljanju koje ćete vidjeti u nadolazećim mjesecima”, rekao je.
“Ne mislim da ćemo dugoročno biti u svijetu u kojem imamo samo jedan divovski model koji pokušava učiniti sve”, dodao je Cox. “Imat ćemo ovaj cool set malih modela koji se mogu proširiti i razmišljati… to je svijet prema kojem mislimo da idemo. Postavite razvojnom programeru kontrolu, dajte mu skup alata koji može … izvršiti različite zadatke i automatizirati stvari i koristiti ovu tehnologiju na načine koji i dalje drže pod kontrolom programera i ljude.”

 

Vezani istraživački radovi

Više iz kategorije

AI - Umjetna inteligencija, Blog, Tehnologije

AI – Umjetna inteligencija, Blog, Tehnologije
11/03/2025
Publikacija "Superintelligence Strategy: Expert Version" autora Dana Hendrycksa, Erica Schmidta i Alexandera Wanga bavi se strategijama za upravljanje rizicima i prilikama koje donosi razvoj superinte…
AI – Umjetna inteligencija, Blog, Tehnologije
27/01/2025
Ulagači su u ponedjeljak 27.1. brzo napustili niz tehnoloških dionica na burzama od Tokija do New Yorka jer je pojava jeftinog kineskog modela umjetne inteligencije dovela u pitanje dominaciju trenutn…
AI – Umjetna inteligencija, Blog, Tehnologije
16/12/2024
Posljednja knjiga pokojnog američkog državnog tajnika Henryja Kissingera, napisana s tehnolozima Craigom Mundiejem i Ericom Schmidtom, Genesis zacrtava put između slijepe vjere i neopravdanog straha d…
AI – Umjetna inteligencija, Tehnologije
09/10/2024
Osnivač Google DeepMinda Demis Hassabis osvojio je zajedničku Nobelovu nagradu za kemiju za korištenje umjetne inteligencije za predviđanje strukture proteina. Hassabis dijeli polovicu nagrade s Johno…
AI – Umjetna inteligencija, Tehnologije
08/10/2024
Geoffrey Hinton, računalni znanstvenik čiji pionirski rad na dubokom učenju 1980-ih i 90-ih podupire sve najmoćnije modele umjetne inteligencije na svijetu danas, dobio je Nobelovu nagradu za fiziku z…
AI – Umjetna inteligencija, Blog, Tehnologije
28/05/2024
Fei-Fei Li nazivaju kumom umjetne inteligencije zbog svog pionirskog rada u računalnom vidu i prepoznavanju slika. Li je izumila ImageNet, temeljni skup podataka velikih razmjera koji je pridonio klju…
AI – Umjetna inteligencija, Blog, Tehnologije
28/05/2024
Popis od 16 istaknutih AI igrača — uključujući OpenAI, Microsoft, xAI, IBM, Google i Meta — obvezao se na AI sigurnost na Safety Summitu u Seulu.  Dotične tvrtke složile su se da neće razvijati ili im…
AI – Umjetna inteligencija, Blog, Tehnologije
15/05/2024
AI – Umjetna inteligencija, Blog, Tehnologije
22/03/2024
Satya Nadella, glavni izvršni direktor Microsofta objavio je organizacijsku novost zaposlenicima: " Danas želim podijeliti uzbudljivu i važnu vijest. Nalazimo se u drugoj godini promjene platforme umj…
AI – Umjetna inteligencija, Tehnologije
15/03/2024
U Poznanu, 325 kilometara istočno od Varšave, tim tehnoloških istraživača, inženjera i skrbnika o djeci radi na maloj revoluciji. Njihov zajednički projekt, ‘Insension’, koristi se prepoznavanjem lica…
AI – Umjetna inteligencija, Blog, Tehnologije
07/03/2024
Microsoft je uložio 2 milijarde eura u francusku AI tvrtku Mistral, integrirajući Mistralov AI model Mistral Large u Azure bez zanemarivanja svog partnerstva s OpenAI-jem. Ovaj strateški potez ne samo…
AI – Umjetna inteligencija, Blog, Tehnologije
07/03/2024
Anthropic je predstavio Claude 3, svoj najnoviji model GenAI chatbota, za koji tvrdi da nadmašuje OpenAI GPT-4 u analitičkim sposobnostima i specifičnim mjerilima. Ovaj napredak značajan je za pokreta…
AI – Umjetna inteligencija, Tehnologije
07/03/2024
DeepMind alumni Yishu Miao i Ziyu Wang predstavili su Haiper, alat za generiranje videa pokretan umjetnom inteligencijom, usred sve većeg interesa za ovo područje nakon izdanja Sora modela OpenAI-ja. …
AI – Umjetna inteligencija, Tehnologije
07/03/2024
   IEEE Spectrum objavio je članak o postavljanju upita velikim jezičnim modelima (LLM) - prompt engineering. Otkako se ChatGPT pojavio u jesen 2022., svi su se okušali u brzom inženjeringu—pronalažen…
AI – Umjetna inteligencija, Tehnologije
13/02/2024
Izvršni direktor OpenAI-ja, Sam Altman, navodno nastoji osigurati neviđeni raspon financiranja od 5 do 7 bilijuna dolara za projekt usmjeren na širenje globalnih mogućnosti proizvodnje čipova i pobolj…
AI – Umjetna inteligencija, Tehnologije
10/02/2024
Coalition for Content Provenance and Authenticity (C2PA), tijelo za globalne standarde koje unapređuje transparentnost na internetu putem potvrđivanja porijekla digitalnog sadržaja, objavilo je da im …
AI – Umjetna inteligencija, Tehnologije
07/12/2023
Google je nadogradio svoj AI chatbot Bard s Gemini, svojim najnovijim modelom umjetne inteligencije, poboljšavajući Bardove mogućnosti rasuđivanja, razumijevanja i planiranja. Gemini, dostupan u Ultra…
AI – Umjetna inteligencija, Tehnologije
01/12/2023
Magazin Foreign Affairs u izdanju za studeni/prosinac 2023. objavio je članak "Nadolazeća ekonomska revolucija umjetne inteligencije". Članak, koji su napisali James Manyika i Michael Spence, govori o…
AI – Umjetna inteligencija, Tehnologije
25/11/2023
Treći vikend u studenom 2023.g. biti će upamćen po zasad najvećoj bitci snaga sigurnosti u razvoju protiv snaga ubrzanja razvoja AI. U tjedan dana konflikt izmedju predstavnika neprofitnog i komercija…
AI – Umjetna inteligencija, Tehnologije
23/11/2023
Konkurentska prednost u brzom svijetu umjetne inteligencije Dok OpenAI prolazi kroz svoje unutarnje sukobe, njegov konkurent Anthropic ne gleda samo sa strane. Pokrenuli su Claude 2.1, ažuriranje svog…
AI – Umjetna inteligencija
10/11/2023
OpenAI održao je 6. 11. u San Francisku prvu konferenciju za razvojne inženjere. Podijelili su desetke novih dodataka i poboljšanja te smanjili cijene u mnogim dijelovima platforme. To uključuje: • No…
AI – Umjetna inteligencija
09/11/2023
Fei-Fei Li je pionir moderne umjetne inteligencije (AI). Njezin rad pružio je ključni sastojak - velike podatke - za otkrića dubokog učenja. Revolucionarni doprinos razvoju suvremene umjetne inteligen…
AI – Umjetna inteligencija
26/09/2023
2020. godine potpredsjednik za istraživanja OpenAI-a Dario Amodei napustio je tvrtku za umjetnu inteligenciju i osnovao suparnički startup pod nazivom Anthropic. U manje od tri godine njegova nova tvr…
AI – Umjetna inteligencija
20/09/2023
Nadolazeći val (The Coming Wave) Sulejmanovo je upozorenje o tehnološkom ekspanzionizmu koje traje cijelom knjigom: na blizu 300 stranica nastoji uvjeriti čitatelje da umjetna inteligencija (AI) i sin…
AI – Umjetna inteligencija
12/09/2023
Google DeepMind lansirao je novi alat za označavanje vodenim žigovima koji označava jesu li slike generirane umjetnom inteligencijom. To je prva velika tehnološka tvrtka koja ga je javno lansirala, na…
AI – Umjetna inteligencija
02/08/2023
Iako se deepfake pornografija bez pristanka godinama koristi za mučenje žena, najnovija generacija umjetne inteligencije čini to još većim problemom. Ti su sustavi puno lakši za korištenje od prethodn…
AI – Umjetna inteligencija
02/08/2023
U manje od tjedan dana otkako je Meta lansirala svoj AI model LLaMA 2, startupi i istraživači već su ga upotrijebili za razvoj chatbota i AI asistenta. Bit će samo pitanje vremena kada će tvrtke počet…
AI – Umjetna inteligencija
21/07/2023
Bijela kuća danas je objavila da su neke od najnaprednijih AI tvrtki u zemlji sklopile dobrovoljni sporazum o upravljanju rizicima povezanim s tehnologijom koja se brzo razvija. Amazon, Anthropic, Goo…
AI – Umjetna inteligencija
16/06/2023
Kako bi AI chatbotovi zvučali pametno i izbacivali manje toksične besmislice tajna je u korištenju tehnike koja se zove pojačano učenje iz ljudskih povratnih informacija, a ona koristi ljude za unos p…
AI – Umjetna inteligencija
06/06/2023
Melissa Heikkila, MIT Technology Review u svom tjednom obraćanju The Algorithm Posljednjih nekoliko tjedana diskursom umjetne inteligencije dominirala je glasna skupina stručnjaka koji misle da postoj…
AI – Umjetna inteligencija
23/05/2023
“ Nikada nije postojao veći rizik da tehnologija uništi naše čovječanstvo. Ova knjiga nije za inženjere koji pišu kod, kreatore politike koji tvrde da ga mogu regulirati ili stručnjake koji stalno diž…
AI – Umjetna inteligencija
16/05/2023
   OpenAI CEO Sam Altman na Odboru američkog Senata odgovara na pitanja u raspravi o utjecaju umjetne inteligencije  Sažetak : • Izvršni direktor OpenAI, Sam Altman, suočio se s pitanjima o umjetnoj i…
AI – Umjetna inteligencija
16/05/2023
Izvršni direktor OpenAI Sam Altman sastat će se sa zakonodavcima na Capitol Hillu ovaj tjedan dok Kongres i Bijela kuća traže moguće načine za reguliranje umjetne inteligencije. Dok industrijski struč…
AI – Umjetna inteligencija
11/05/2023
No stručnjaci kažu da bi se puštanje ovih modela u divljinu prije popravljanja njihovih nedostataka moglo pokazati iznimno riskantnim za tvrtku. Google stavlja moćne nove AI alate u tone svojih postoj…
AI – Umjetna inteligencija
03/05/2023
   ChatGPT je najbrže rastuća potrošačka aplikacija svih vremena, kojoj je bilo potrebno samo pet dana da dosegne milijun korisnika i samo dva mjeseca da dosegne 100 milijuna korisnika. Microsoftovo u…
AI – Umjetna inteligencija
02/05/2023
   Pola stoljeća dr.Geoffrey Hinton njegovao je tehnologiju u srcu chatbota kao što je ChatGPT. Sada napušta Google kako bi mogao slobodno podijeliti svoju zabrinutost da bi umjetna inteligencija mogl…
AI – Umjetna inteligencija
02/05/2023
   Za razliku od prošlih tehnoloških inovacija, umjetna inteligencija ne govori o gospodarenju čovječanstva nad prirodom, već o potpunom odricanju kontrole. Shvaćali mi to ili ne, stara antropocentrič…
AI – Umjetna inteligencija
14/04/2023
Jučer, 12.4.2023. u 18:08h, Greg Brockman, predsjednik i suosnivač OpenAI objavio je na Twitteru slijedeći komentar/stav: "Temeljni duh u mnogim raspravama o tempu napretka umjetne inteligencije – da …
AI – Umjetna inteligencija
13/04/2023
Istraživači sa Stanforda upotrijebili su Generativnu AI za simulaciju uvjerljivog ljudskog ponašanja u simuliranom svijetu. "Generativni agenti se probude, skuhaju doručak i krenu na posao; umjetnici …
AI – Umjetna inteligencija
13/04/2023
Ne vidimo često da tehnologije dobivaju eksponencijalno usvajanje i pozornost u vrlo kratkom vremenskom okviru na način na koji je to postigao OpenAI-jev ChatGPT od kasne 2022. g. Procjenjuje se da je…
AI – Umjetna inteligencija
12/04/2023
Ne čitam svaki dan predviđanje propasti koje je tako zastrašujuće kao ono Eliezera Yudkowskog u časopisu Time prošlog tjedna. “Najvjerojatniji rezultat izgradnje nadljudski pametne umjetne inteligenci…
AI – Umjetna inteligencija
12/04/2023
Otvoreno pismo Future of Life Institute objavljeno danas poziva "sve AI laboratorije da odmah zaustave na barem 6 mjeseci obuke AI sustava moćnijih od GPT-4." Ovaj 6-mjesečni moratorij bio bi bolji ne…
AI – Umjetna inteligencija
05/04/2023
Apel Instituta za budućnost života - Future of Life Institute Uz izdanje GPT-4, OpenAI je objavio dva dokumenta: tehničko izvješće o mogućnostima GPT-4 i sistemsku karticu, koja detaljno opisuje mnoge…
AI – Umjetna inteligencija
04/04/2023
Prošlog proljeća, u "Turingova zamka: Obećanje i opasnost umjetne inteligencije slične ljudskoj", ekonomist sa Stanforda Erik Brynjolfsson upozorio je da su kreatori umjetne inteligencije bili previše…
AI – Umjetna inteligencija
04/04/2023
Nedavna pojava generativne umjetne inteligencije (AI) postavlja pitanje jesmo li na rubu ubrzanja automatizacije zadataka koja će dovesti do uštede troškova rada i povećanja produktivnosti. Unatoč zna…
AI – Umjetna inteligencija
04/04/2023
Više od 250 godina temeljni pokretači gospodarskog rasta bile su tehnološke inovacije. Najvažnije od njih su ono što ekonomisti nazivaju GPT - tehnologijama opće namjene—kategorija koja uključuje parn…
AI – Umjetna inteligencija
02/04/2023
 Problem s novim chatbotovima nije samo to što su često glupi i naivni; to je da nisu dovoljno "glupi" ili "naivni" da uhvate nijanse, ironije i razotkrivajuća proturječja koja sačinjavaju ljudsku kul…
AI – Umjetna inteligencija
13/02/2023
Potpolje umjetne inteligencije koje se fokusira na stvaranje novih podataka ili sadržaja zovemo “GAI -generativna AI” a razlikuje se od analitičke AI po tome što više ne služi samo za analizu postojeć…
AI – Umjetna inteligencija
13/03/2022
Dr. Erik J. Larson u Mitu o umjetnoj inteligenciji  pridružuje se malom skupu glasova koji prosvjeduju da polje umjetne inteligencije slijedi put koji ne može dovesti do generalizirane inteligencije. …
AI – Umjetna inteligencija
04/03/2020
Umjetna inteligencija trebala bi utjecati na svaki aspekt naših života, ne samo na način na koji je proizvodnja organizirana. AI, kao tehnološka platforma, može automatizirati zadatke koje je prethodn…
AI – Umjetna inteligencija
10/01/2020
Znanstvena zajednica još uvijek se nije usuglasila oko definicije : Umjetna inteligencija je naziv koji se može pridodati svakom neživom sustavu koji pokazuje sposobnost snalaženja u novim situacijama…
AI – Umjetna inteligencija
06/10/2019
Američki investitor u nove tehnologije (vidi Gideon Brothers), zagrebački FSB-ovac Mislav Tolušić, na portalu Arhivanalitika uvodi čitatelje u područje umjetne inteligencije (AI) iz perspektive invest…
Scroll to Top