OpenAI održao je 6. 11. u San Francisku prvu konferenciju za razvojne inženjere.
Podijelili su desetke novih dodataka i poboljšanja te smanjili cijene u mnogim dijelovima platforme. To uključuje:
• Novi GPT-4 Turbo model koji je sposobniji, jeftiniji i podržava 128K kontekstni prozor
• API za nove pomoćnike koji programerima olakšava izradu vlastitih pomoćnih aplikacija za umjetnu inteligenciju koje imaju ciljeve i mogu pozivati modele i alate
• Nove multimodalne mogućnosti na platformi, uključujući vid, stvaranje slika (DALL· E 3) i pretvaranja teksta u govor (TTS)
Prvu verziju GPT-4 objavili su u ožujku i učinili GPT-4 općenito dostupnim svim programerima u srpnju. Danas pokreću pregled sljedeće generacije ovog modela, GPT-4 Turbo.
GPT-4 Turbo je sposobniji i ima znanje o svjetskim događajima do travnja 2023. godine. Ima kontekstni prozor od 128k, tako da može smjestiti ekvivalent više od 300 stranica teksta u jedan upit. Također su optimizirali njegove performanse tako da su u mogućnosti ponuditi GPT-4 Turbo po 3x jeftinijoj cijeni za ulazne tokene i uz 2x jeftiniju cijenu za izlazne tokene u usporedbi s GPT-4.
Objavljen je izlazak API pomoćnika, prvi korak prema pomaganju razvojnim programerima da izgrade iskustva slična agentima unutar vlastitih aplikacija. Pomoćnik je namjenska umjetna inteligencija koja ima specifične upute, koristi dodatno znanje i može pozivati modele i alate za obavljanje zadataka. Novi API pomoćnik pruža mogućnosti kao što su dohvat i tumačenje koda, te vam uz ostale funkcije koje ste prethodno morali sami obaviti omogućuje izradu visokokvalitetnih aplikacija za umjetnu inteligenciju.
GPT-4 Turbo može prihvatiti slike kao ulaze u API za dovršavanje chata, omogućujući slučajeve upotrebe kao što su generiranje titlova, detaljna analiza slika iz stvarnog svijeta i čitanje dokumenata s brojkama. Na primjer, BeMyEyes koristi ovu tehnologiju kako bi pomogao slijepim ili slabovidnim ljudima sa svakodnevnim zadacima poput identificiranja proizvoda ili navigacije trgovinom.
DALL· E 3
Razvojni programeri mogu integrirati DALL· E 3, koji je nedavno lansiran korisnicima ChatGPT Plus i Enterprise, izravno u njihove aplikacije i proizvode putem Images API-ja navodeći dall-e-3 kao model. Tvrtke poput Snapa, Coca-Cole i Shutterstocka koristile su DALL· E 3 za programsko generiranje slika i dizajna za svoje klijente i kampanje.
Pretvaranje teksta u govor (TTS)
Razvojni programeri sada mogu generirati govor ljudske kvalitete iz teksta putem API-ja za pretvaranje teksta u govor. Novi TTS model nudi šest unaprijed postavljenih glasova na izbor i dvije varijante modela.
Više o detaljima, nižim cijenama i ograničenjima pročitajte na OpenAI