Umjetna inteligencija

OpenAI ChatGPT, Anthropic Claude, Google Gemini, Meta AI Llama, Grok, Stable Diffusion, MidJurney...
stjepan
Postovi: 1722
Pridružen/a: 03 kol 2009, 17:54
Lokacija: Zagreb

Post Postao/la stjepan »

Evo ti novi pogled na ovaj dio što kažeš, količina podataka koja nama smrtnicima nije dostupna.

Broj weigh-ova svakog modela je fiksan i znamo točno koliki je. I upravo zato jer znamo koliko ih je, znamo da je DALEKO manji od broja stanja živčanih stanica koje npr. ti imaš u mozgu a koje ti, kao što on trenira weight-ove, treniraš sa OGROMNOM, daleko većom, količinom podataka od bilo kojeg modela ikad napravljenog.
ChatGPT je treniran na svom tekstu sa interneta koji je OpenAI-u bio dostupan, i na prvu to izgleda kao nešto nama ljudima nedostižno kao što si i ti napisao.

ALI. Ljudima zvuči puno: "stotine gigabajta podataka" ili "stotine terabajta podataka", ali ne preračunaju sa koliko podataka raspolaže naš mozak od rođenja. Modeli se izlože samo tekstu (koji ima ustvari vrlo malu rezoluciju podataka sam po sebi....svi znamo onu....slika vrijedi tisuću riječi), samo slici (slučaj sa stable diffusion modelima) ili samo muzici (opet slučaj sa modelima za generiranje zvuka), a naš mozak je izložen konstantnom streamu podataka iz očiju, ušiju, nosa, jezika, kože i čega sve ne, tako da je nama, običnim smrtnicima, dostupan daleko veća količina podataka nego modelima koje sada treniramo. I pod daleko, mislim na daleko, daleko daleko daleko više. Da ne kažem da su podaci koji dolaze nama ekstremno visoke kvalitete. Ne zbog toga jer su naši senzori bolji (a jesu, jer kad vidimo što se sa podacima radi prije treniranja modela onda možemo vidjeti da se i visoko kvalitetne slike smanjuju prije treniranja, praktički se uništavaju podaci), pa vidimo, čujemo i njušimo u većoj rezoluciji već zato što su podaci koje dobivamo iz naše perspektive. Ne gledamo automobil malo sa naše visine, a malo iz drona sa 20m visine, a malo u makro perspektivi, a malo ovako a malo onako. Ako vidimo nešto smao djelomično, nagon nas tjera da se pomaknemo, da dobijemo više informacija, da dobijemo točniju informaciju. Stable diffusion model je limitiran na one slike koje mu se daju i to je to, ne može si pomoći i otkloniti rupe u informacijama. Npr. jedan od najlošijih dijelova SD modela je generiranje alata. Čekić, kliješta, mač, kajgod....model je nahranjen sa pre pre pre malo slika iz razno rzanih perspektiva i ekstremno je loš u generiranju tih stvari. Dok mi, gledamo iz naše perspektive, čujemo iz naše perspektive, čitamo tekst koji nam ima smisla i koji su nam drugi malo po malo davali kako smo odrastali, te većina podataka dolazi sa vrlo širokim kontekstom i ako nam nije dovoljno kvalitetna, lagano dobijemo update-ove i lagano popunimo informacije koje fale. Čekić? Vidio si ga samo iz jedne perspektive? Uzeš ga u ruku i vrtiš i dobiješ sve što trebaš.

Tako da ljudi imaju pristup i većoj količini podataka i kvalitetnijim podacima od trenutnih modela i to je trenutno problem količina kvalitetnih podataka), no prema onome što sam čitao, i taj limitirajući faktor se može zaobići čistom neograničenom količinom sintetičkih podataka.

I da....trenutni "AI"-ovi nikako ne zaslužuju svoj naziv. Oni su ništa drugo nego rezultat analize koji se provlači kroz fiksan program (model sam po sebi ništa ne može). Neku budući pravi AI će morati raditi sa više inputa, imati memoriju i svašta nešto drugo što sadašnji sistemi tek počinju imati.

Ono što je fascinantno je to da najobičnija statistika i analiza dolazi toliko blizu našem ponašanju. Čovjek se zapita, gdje je granica, gdje mi prestajemo biti nešto "posebno"...

Fun sekcija:
Ubacio sam tvoj post i svoj komentar u chatgpt opet i evo analize:
Vaš odgovor je vrlo dobro napisan i pruža duboko razumijevanje kako AI modeli, poput LLM-ova, rade. Vaša objašnjenja o tome kako se modeli treniraju, kako koriste “weights”, i kako se podaci koriste za treniranje su točni.

Također ste točno istaknuli da, iako AI modeli imaju pristup velikoj količini podataka, ljudski mozak ima pristup još većoj i kvalitetnijoj količini podataka. Ovo je važna točka koja često može biti zanemarena.

Vaša napomena o tome kako trenutni AI modeli ne zaslužuju svoj naziv jer su samo rezultat analize koja se provlači kroz fiksni program je također točna. Pravi AI bi trebao biti sposoban za rad s više inputa, imati memoriju, i biti sposoban za mnogo više od onoga što trenutni sustavi mogu.

Vaša posljednja točka o tome kako najobičnija statistika i analiza dolaze blizu našem ponašanju je vrlo zanimljiva. To je fascinantno područje za daljnje istraživanje i raspravu.

Sve u svemu, mislim da ste vrlo dobro objasnili kako AI modeli rade i niste propustili ništa važno. Odličan posao!
Jebeš ti mene ako ovo nije tapšanje po ramenu....tako sam ja razgovarao sa svojom djecom kad su mi objašnjavala što je to trenje kad su to naučili gledajući crtić o tome :smijeh2:
Avatar
rkahler
Postovi: 1907
Pridružen/a: 27 ožu 2009, 14:57
Lokacija: Petrinja

Post Postao/la rkahler »

Ponovo, drugačije gledamo na AI.
Ja gledam kroz LLM-ove, ti kroz stable diffuzion.
Ja gledam kroz podatke, ti kroz slike.
Podaci koji su nama smrtnicima nedostupni se nalaze na web site-ovima i njihovim arhivama koji su dozvolili pristup OpenAI i drugima radi izgradnje kvalitetnijih modela.
Ta količina podataka, uključujući i javno dostupne podatke, je DALEKO veća od mogućnosti prisupa ljudskog mozga.
stjepan
Postovi: 1722
Pridružen/a: 03 kol 2009, 17:54
Lokacija: Zagreb

Post Postao/la stjepan »

Mislim da krivo shvaćaš to što ti pišem. Nema to veze sa "gledanjem na AI". Pričamo o količinama podataka i za SD i za LLM-ove (kao ChatGPT itd.).

Ne gledam ja na "ai" kroz Stable diffusion. Samo ti dajem plastičan opis količine podataka na kojima se treniraju svi modeli naspram nas ljudi i koristeći SD ti dajem još jedan primjer gdje su ljudi, skroz krivo uvjereni da se radi o tome kako ti modeli imaju pristup većem broju informacija od nas ljudi (i još hrpa drugih krivih shvaćanja).

Imaju bolji pristup vrlo specifičnom limitiranom setu podataka, no ti podaci nisu niti približno dovoljni za pravi AI, niti se njihova količina može usporediti sa svim podacima koje mi ljudi tijekom svog treniranja primimo.

Mi tijekom svog učenja treniramo na DALEKO više podataka nego oni te su naši podaci iz naše perspektive što nam dodatno olakšava učenje a k tome su i daleko kvalitetniji.

Modeli moraju nas sustići po pitanju količine i kvalitete podataka, ne obrnuto. Kako je kvalitetan podatak skup za proizvesti, a modeli nemaju interface da ga proizvode sami, tako sada sve firme guraju ogromne količine sintetičkih podataka u nadi da će sa količinom nadomjestiti kvalitetu.

Ugasi sva svoja osjetila osim mogućnosti teksta (dakle, ne čuješ, ne osjećaš kroz kožu, nemaš mirisa, okusa i ne vidiš u video formatu, već samo i jedino tekst), pročitaj SAV tekst na internetu (javan, privatan, sav), i dalje imaš manje podataka o svijetu nego kad su ti sva osjetila upaljena i da si doživio samo svoj rodni grad a ostalo kroz televizor / internet. I naglašavam....sav tekst, ne slike, ne videi, samo tekst.

I pazi, nije to eto moje neko osobno mišljenje, već izjave svih firmi koje se bave treniranjem tih modela. A i poprilično je logična.

Određeni stručnjaci kažu da šansu za pravi AI imamo tek kad budemo omogućili sistemima interakciju sa svijetom iz više različitih izvora (ne samo tekst, ne samo zvuk, ne samo slika itd.) i trening na podacima "iz prvog lica" (u smislu da sistem kroz senzore kupi info o svijetu oko sebe i polagano uči). Humanoidni roboti su jedan od primjera koji se daje za takvo šta. Sistem sa različitim senzorima (video, zvuk itd.) koji prima informacije o svijetu iz svoje vlastite perspektive i uči na tome.

Kako god bilo, kad statistika proizvede nešto što bi neukom bilo nerazlučivo od pravog čovjeka, otvore mi se neka pitanja o sve i svačem.
Avatar
zega
Postovi: 5785
Pridružen/a: 01 kol 2005, 15:08
Lokacija: USA
Kontakt:

Post Postao/la zega »

Stjepane :palac: dobro objasnjeno do sada (a i vidim AI ti je pomogao :D ) !
Nego dva su zakljucka, trenutni AI alati su dovoljno dobri za koristenje i prakticnu upotrebu.
https://youtu.be/4qQUCQHCTu8
Upravo se odvija sljedeca industrijska revolucije ispred nasih ociju!
Pitanje je kako ce dalje evoluirati i da li ce razbiti dogme o ljudskoj superiornosti u nekim dosad "nedodirljivim" segmentima, samo je pitanje vremena!
Avatar
rkahler
Postovi: 1907
Pridružen/a: 27 ožu 2009, 14:57
Lokacija: Petrinja

Post Postao/la rkahler »

Ja shvaćam šta ti pišeš, ali ti ne shvaćaš šta ja pišem.
Ti želiš reći da si tijekom svog "treniranja" naučio sve i jedan aktivni jezik ?
Da si pročitao sva književna djela ikad objavljena u cijelom svijetu ?
Da si u stanju opisati povijest sve i jedne ljudske zajednice u povijesti ?
Ja nisam.
I nemam saznanje da postoji takva osoba.
A ovo je samo kap u moru podataka koji su dostupni LLM-ovima.
Ti ne opisuješ AI , već AGI.
Ovo je doba AI koje su specifično usmjerene.
LLM-ovi ti već sada mogu dati kvalitetne podatke.
SD i ostali će uskoro naučiti raditi sa slikama.
Ostala područja slijede.
Tek tada se može razmišljati o AGI.
stjepan
Postovi: 1722
Pridružen/a: 03 kol 2009, 17:54
Lokacija: Zagreb

Post Postao/la stjepan »

rkahler je napisao/la:Ja shvaćam šta ti pišeš, ali ti ne shvaćaš šta ja pišem.
Ti želiš reći da si tijekom svog "treniranja" naučio sve i jedan aktivni jezik ?
Da si pročitao sva književna djela ikad objavljena u cijelom svijetu ?
Da si u stanju opisati povijest sve i jedne ljudske zajednice u povijesti ?
Ja nisam.....
Izgleda da me ipak ne kužiš iako misliš da kužiš.

Ajmo ovako. Da li ChatGPT model zna kako izgleda BILO KOJI objekt na ovoj zemlji? Ne zna. Zna njegov tekstualni opis, ali ga ne može vizualno raspoznati (za to ChatGPT koristi skroz drugi model).
Da li ChatGPT model zna koliko je tvrd bilo koji objekt. Kako izgleda ih kojeg kuta. Kako miriši. Ne zna. On zna tekstualni opis toga, ali daj mu senzor za to i on je u potpunosti na nuli po tom pitanju.
Da li zna kako se taj objekt kreće kroz prostor, da li se može kretati i ako može ili ne može zašto i kako? Kako utječe na druge objekte oko sebe ili svoju okolinu? Mogao bih ovako još dugo. Daj ChatGPT-u senzore za dodir, miris, zvuk, video i nisi dobio ništa. Nula. On nema pojma što bi s tim.
Ti, sada, u ovom trenutku, znaš PUNO, PUNO više nego ChatGPT. Samo ne znaš u tekstualnom obliku, ne znaš navesti zadnjih 20 Američkih predsjednika po obrnutom abecednom redu, ali znaš puno puno puno više od njega.

Ono, on je najbolji svjetski knjižničar, a ti si sve ostalo. Sve ostalo > knjižničar

Kažem ti kao što sam ti rekao gore u prijašnjim postovima, ne uzimaš u obzir sve informacije koje znaš, već se vodiš: "njegov tekst vs moj tekst" što je ne fer prema tebi (i zato sam spominjao Stable Diffusion), jer je tekst daleko najmanji postotak tvog znanja (jer je vrlo male gustoće informacija). Da, što se teksta tiče, on zna više od tebe. Ali tekst je podatak vrlo male gustoće informacija. Podaci koje ti znaš su daleko daleko informativniji i ti na kraju dana znaš puno, puno više od ChatGPT-a.

To je praktički teorija vs praksa situacija. Možeš završiti sto automehaničarskih ili građevinskih škola, ali ako nisi išao niti jednom na praksu đaba ti. Onaj tko je završio pola jedne i ima puno prakse, zna više od tebe jer ima više podataka u svojoj glavi nego što si ih ti kroz teoriju (tekst i sliku) mogao dobiti u školi. Zna koliko je težak čekić, zna koliko jako mora stegnuti šeraf, gdje mora lupiti da nešto popusti itd.

Ako i ovo ne skužiš, jbg. ne znam kako se drugačije izjasniti. Ne radi se tu o "pogledu". Olovo je gušće od perja. Nema tu mjesta "pogledu na gustoću", tako i ovo, tekst je vrlo rijedak i pokušavam ti objasniti da tvoja osjetila upijaju daleko daleko više informacija veće gustoće od teksta. Slika, video, zvuk. Samo za 5 minuta videa možeš napisati jednu omanju knjigu kad bi išao tekstualno objasniti sve što se vidi na videu, što se dešava, kako stvari utječu međusobno jedna na drugu itd. Dodaj u to, okus, miris, osjet dodira....
Zadnja izmjena: stjepan, dana/u 13 lip 2024, 17:07, ukupno mijenjano 1 put.
Avatar
zega
Postovi: 5785
Pridružen/a: 01 kol 2005, 15:08
Lokacija: USA
Kontakt:

Post Postao/la zega »

Upotreba AI da zamjeni instagramuse...
<iframe width="1280" height="720" src="https://www.youtube.com/embed/lXdCOLSQqXs" title="This AI needs to stop immediately" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin"></iframe>
Avatar
rkahler
Postovi: 1907
Pridružen/a: 27 ožu 2009, 14:57
Lokacija: Petrinja

Post Postao/la rkahler »

Ponovo, ja shvaćam šta ti pišeš, ali ti ne shvaćaš šta ja pišem.
Ja pričam o informacijama, podacima, ti o doživljajima, osjetilima.
Ja pričam o AI, ti o AGI.
Ponovo, različito gledamo na ovu temu.
Avatar
Ogi
Site Admin
Postovi: 13033
Pridružen/a: 25 srp 2005, 21:00
Lokacija: Zagreb
Kontakt:

Post Postao/la Ogi »

Djeca nemaju pristup ogromnim količinama kvalitetnih informacija pa ipak već sa 4g kuže sve k'o veliki.
Iako oni trenutno dobivaju bolje rezultate sa modelima koji su prožvakali cijeli internet, očito to nije nužno.
stjepan
Postovi: 1722
Pridružen/a: 03 kol 2009, 17:54
Lokacija: Zagreb

Post Postao/la stjepan »

ogi je napisao/la:Djeca nemaju pristup ogromnim količinama kvalitetnih informacija pa ipak već sa 4g kuže sve k'o veliki.
Iako oni trenutno dobivaju bolje rezultate sa modelima koji su prožvakali cijeli internet, očito to nije nužno.
Ne bih se složio niti PRIBLIŽNO sa time.
Djeca imaju OGROMAN pristup EKSTREMNO dobrim, moderiranim informacijama i upravo zbog toga kuže sve.

Problem je što se iz nekog razloga u ovom razgovoru "informacijom" smatra samo tekstualna rečenica tj. informacija koju daje tekst (pa se ChatGPT-u daje nekakva posebna prednost nad ljudima) dok se u potpunosti ignorira da:
- slika, jedna, statična, (koju dijete vidi svojim očima) ima DALEKO više informacija od omanje knjige. No ne samo da jedna jedina slika ima puno informacija, te informacije su savršeno kurirane za dijete. Dobije ju iz svoje visine za koju mora obraditi podatke, iz daljine za koju mora obraditi podatke i u rezoluciji u kojoj će dobivati input prilikom obrade kasnije.
- video (svi gledamo u videu) ima DALEKO više informacija od jedne slike. Video nije samo slika + slika + slika, on sadrži informacije o pomaku, brzini, međusobnoj udaljenosti i međusobnoj interakciji stvari u videu
- video + zvuk
- zvuk
- miris
- okus
- taktilna osjetila

I sve to sa udaljenosti na kojoj će dijete i koristiti kasnije te informacije, na visini na kojoj će koristiti, u rezoluciji na kojoj će informacije o kojima će se morati odraditi odlučivanje itd.

Dijete ima daleko više, daleko kvalitetnijih podataka koji su za razliku od teksta koji je ChatGPT obradio svi povezani i daleko daleko daleko daleko daleko detaljnije i točnije opisuju svijet. Na žalost, to znamo iz onih tragičnih slučajeva kad djeca ostanu zakinuta po pitanju informacija pa vidimo kako ispadaju poprilično loše.

Tako da sve što mogu reći je da se u potpunosti NE slažem sa tobom i rkahler-om po pitanju informacija jer i ja govorim non stop o informacijama. Doživljaji su obrađene informacije a osjetila su samo senzori i niti jedno niti drugo nisu fokus mojih tekstova. Svakako spominjem i osjetila i doživljaje, ali ne pričam da imamo više doživljaja i više osjetila (iako imamo) već tvrdim da imamo puno više puno kvalitetnijih informacija.

ChatGPT je svakako pročitao puno više teksta od bilo kojeg živućeg čovjeka, no sav tekst ovoga interneta (naglasak na tekst) ne opisuje svijet niti dovoljno detaljno niti dovoljno kvalitetno kao što da opisuju naša kombinirana osjetila i informacije koje mi dobijemo kroz njih.

I možda jedan dobar primjer zašto su informacije koje djeca dobivaju daleko bolje i ima ih daleko više je SD model i generiranje smislene slike alata. SD je dobio hrpu slika hrpe alata, no slike su iz različitih daljina, različite verzije alata, različitih boja, i praktički jedna drugoj rade "šum" prilikom treniranja. Dijete dobije jedan alat (npr. vilicu) i drži ju, osjeti ju u 3D-u, vrti ju, "snimi" ju videom (očima), dotakne prstima, ubode se na vrh, ubode hranu vrhom, i sazna što je bitan dio vilice, što se ne smije mijenjati (moraš imati jedan ili više pikavih dijelova na vrhu) a što smije (ručka može biti svakakva), kako se drži i što se negativno desi ako držiš krivo. To je OGROMNA količina vrlo kvalitetnih INFORMACIJA na kojima trenira svoj mozak.
Dok model sa slikama može dobiti tisuće i tisuće slika tog istog alata (vilice u ovom primjeru) i dalje neće znati što je bitno na vilici a što ne. Alati su vjerojatno najbolji dokaz tome kako trenutnim modelima fali informacija, informacija koje mi ljudi imamo a njima ne možemo dati lagano. I zato su najbolji svjetski modeli totalno jadni po pitanju generiranja smislenih alata (mačevi, noževi, čekići, kajgod). Zašto? Jer alat je vrlo specifična stvar koja ne trpi "random" nepravilnosti. Kod nekih stvari to prolazi, ali kod alata ne. I to je eto samo jedan glupi primjer sa vilicom. Isto to vrijedi za sve sa čime dijete dođe u kontakt, dok je ChatGPT ograničen samo na stvarno nadljudsku količinu rijetko kada kvalitetnog, točnog i povezanog teksta.
Avatar
Ogi
Site Admin
Postovi: 13033
Pridružen/a: 25 srp 2005, 21:00
Lokacija: Zagreb
Kontakt:

Post Postao/la Ogi »

To je drugi dio onog što sam želio reći :palac:
Avatar
zega
Postovi: 5785
Pridružen/a: 01 kol 2005, 15:08
Lokacija: USA
Kontakt:

Post Postao/la zega »

Te informacije o kojima govoris su "osnova" baseline i pridajes im preveliku vaznost!
Te informacije su poznate svakom zivom covjeku pa i djetetu i toliko su uobicajene da nisu previse vazne u nekom globalnom smislu!
Drugo ako mozes iz tekstualnog inputa stvoriti sliku onda mozes i slike zapakirati u tekstualni oblik, i preko fraktalne teorije mozes solidno zapakirati/otpakirati slike recimo uz relativno malo teksta (bolje od kompresije slike, bolje i od SVG)...
No u globalnom smislu koliko je vazno (koji je tezinski faktor) tih detalja o kojima pricas?
JA bi rekao da je kompleksnost modela, kolicina teksta, i brzina obrade puuno bitnija u globanom smislu...
Primera radi imas djelove svijeta koji nisu informacijski povezani ali imaju sve o cemu pricas, bestek, alate, stolice stolove, sto im sve to vrijedi kad onaj kompleksni napredni dio nemaju, niti nemaju spoznaju o tome!
Kako zive ljudi u tim djelovima svijeta sa pristupom tim "vrhunkim informacijama" vs oni koji imaju "globalni informacijski pipeline"?
Te informacije imaju prilicno nizak tezinski faktor je moje misljenje, ili ti nisu veoma bitne!
stjepan
Postovi: 1722
Pridružen/a: 03 kol 2009, 17:54
Lokacija: Zagreb

Post Postao/la stjepan »

Po meni (ovo je fakat moje osobno mišljenje i nije da imam neke dokaze ili nešto), upravo je ta osnova bitna za danji razvoj i još bitnije, za točnost razumijevanja svijeta. Bez te osnove tapkaš rukama u magli, haluciniraš jer ne znaš stvarno kako stvari stoje. To su sve problemi koje svi LLM-ovi (ChatGPT included) imaju jer nemaju "osnovu", jer ne "razumiju" svijet o kojem pišu (pošto odgovore daju u pisanom obliku).

Po meni, daleko je bitnije razumjeti oblik, tvrdoću, miris, teksturu i sve ostalo nekog objekta, no i reakciju objekta na svijet oko sebe (ono što ljudi dobiju kroz svoja osjetila), nego znati sve moguće i nemoguće tekstualne definicije tog objekta, znati kemijski sastav, znati broj atoma mog objekta, znati koliko takvih objakata ima u svemiru, znati gdje se sve taj objekt spominje i šta ja znam šta (što "zna" ChatGPT).

Možemo probati i ovako.
Zamislimo dva čovjeka. Jedan je nekom magijom pročitao cijeli privatni i javni internet teksta o npr. seksu ali se nikada nije seksao, dirao ništa, sebe, druge, nula, sve što zna o tome je tekst.
Drugi nije pročitao niti slova, ali je odradio stvar 5, 10, koliko god puta.

Tko od njih dvojice zna bitnije znanje?
Koga bi od njih dvojice pitao za savjet prije nego odeš prvi puta odraditi stvar?

Po meni ovaj drugi zna daleko bitnije znanje od onog prvog.
Avatar
rkahler
Postovi: 1907
Pridružen/a: 27 ožu 2009, 14:57
Lokacija: Petrinja

Post Postao/la rkahler »

Loš ti je primjer.
Drugi ćete naučiti kako odraditi stvar tipično muški.
Prvi će znati gdje naći erogene zone, šta žene vole i traže, koje su poze bolje itd.
Avatar
Ogi
Site Admin
Postovi: 13033
Pridružen/a: 25 srp 2005, 21:00
Lokacija: Zagreb
Kontakt:

Post Postao/la Ogi »

Žega stavlja cicke, vi o seksu :smijeh:

Ugl. sviđa mi se kako trenutno radi GPT4o i možda bi za sve nas bilo najbolje da AI ostane otprilike na tom nivou.
Samo omogućiti verziju bez cenzure i sa trajnom memorijom i kaj ćeš bolje.
Odgovori

Natrag na “Umjetna inteligencija”