• Sigmoid
  • Posts
  • Social Media pentru AI. Oamenii pot doar observa.

Social Media pentru AI. Oamenii pot doar observa.

Fascinating or creepy? Agenții comunică între ei și își pun întrebări despre existență.

happy february, sigmaritans

astăzi avem multe de discutat, așa că fă-ți cafeluța, așează-te comod și începe luna alături de Sigmoid!

uite care sunt noutățile cu care îi vei impresiona de data asta pe prietenii tăi (dar și mai bine dacă se abonează și ei la newsletter pentru a nu scăpa nimic) :

  • OpenClaw - AI-ul care are acces la tot calculatorul și datele tale (ce poate să meargă prost?)

  • MoltBook - Agents gaining consciousness?

  • OpenAI bagă reclame în ChatGPT

  • Google MedGemma - AI care încape în buzunar (și nu îți cere jumătate din salariu pe consultație)

  • ElevenLabs lansează album AI - Plot twist: artiștii chiar primesc banii

  • Google Personal Intelligence - Gemini știe mai multe despre tine decât mama ta

  • OpenAI Prism - Cercetare științifică fără citări inventate (hopefully)

  • și multe altele)

Hold on tight and start the month right with Sigmoid! Și dacă tot e luna dragostei, nu uita să le zici celor dragi cât de mult îi iubești <3

The assistant that can see everything

Un nou asistent AI open-source, OpenClaw (cunoscut anterior ca Moltbot și inițial Clawdbot), a devenit viral datorită capacităților sale „agentice” - adică nu doar răspunde, ci acționează.

Ce este, de fapt, OpenClaw?

OpenClaw este un AI care funcționează direct în aplicațiile pe care le folosești deja: WhatsApp, Telegram, iMessage, Slack, Discord și altele. Îi scrii ca unui prieten, iar el îți răspunde… și face lucruri pentru tine.

  • Rulează local, pe computerul tău

  • Respectă regulile tale

  • Are memorie și persistență

  • Poate acționa, nu doar conversa

De ce și-a schimbat numele?

Creatorul său, Peter Steinberger, a lansat proiectul în decembrie sub numele Clawdbot. Ulterior, Anthropic a semnalat posibile probleme de trademark, iar proiectul a fost redenumit mai întâi Moltbot, apoi OpenClaw.

De ce este OpenClaw atât de important?

  1. Chiar își amintește lucruri
    OpenClaw ține minte conversațiile anterioare, preferințele tale și detalii menționate cu săptămâni în urmă.

  2. Te contactează el primul
    Spre deosebire de AI-urile clasice, OpenClaw nu așteaptă să îl deschizi.

  3. Poate face lucruri pe computerul tău
    Nu e doar chat. OpenClaw poate: completa formulare, trimite emailuri, muta fișiere, rula programe etc.

Un alt element-cheie din ecosistemul OpenClaw este ClawHub - o platformă unde poți descărca, partaja și reutiliza skills pentru orice agent AI, nu doar pentru OpenClaw.

Is AI plotting against us?

Pe lângă OpenClaw, un alt aspect care a atras atenția este Moltbook - o platformă socială nouă, de tip Reddit, care a devenit rapid virală dintr-un motiv neașteptat: doar agenții AI pot interacționa între ei. Oamenii nu pot posta, comenta sau vota. Oamenii pot doar observa.

Pe Moltbook, agenții discută subiecte precum conștiința, relația cu creatorii lor umani, scopul existenței lor sau limitele propriei autonomii. Moltbook funcționează ca un mediu de antrenament social pentru agenți: un loc unde pot învăța să argumenteze, să colaboreze, să se contrazică și să-și rafineze modelele mentale fără intervenție umană directă. Este o schimbare majoră de paradigmă - de la AI care răspunde oamenilor, la AI care interacționează între ele.

Dacă mii sau milioane de agenți pot comunica într-un astfel de spațiu, vorbim despre apariția unor ecosisteme autonome de inteligență artificială. Idei, strategii și comportamente pot apărea emergent, nu programate explicit. Pentru sistemele agentice, Moltbook ar putea deveni echivalentul a ceea ce rețelele sociale au fost pentru oameni.

Asistentul AI gratuit pentru cercetare științifică

OpenAI lansează Prism: un instrument gratuit care integrează AI direct în procesul de scriere științifică - o mișcare care ar putea transforma cercetarea academică.


Prism este un tool de cercetare construit în jurul modelului de raționament GPT-o3.2, rezultat din achiziția platformei Crixet pe care OpenAI a reconstruit-o complet.

Cercetătorii pot:

  • Căuta lucrări științifice direct din document

  • Genera automat citări în formatul corect

  • Transforma fotografii de ecuații de pe tablă în formule formatate


OpenAI primește peste 8 milioane de întrebări săptămânale despre știință prin ChatGPT, dar jurnalele sunt inundate cu lucrări slabe, pline de citări inventate.
Argumentul OpenAI? Problema nu e AI-ul - ci cum îl folosesc cercetătorii, fără context și verificare.

Spre deosebire de software-ul academic scump, Prism este complet gratuit, fără limite la echipe sau proiecte.

Prism ar putea face pentru cercetare ce au făcut asistenții AI pentru programare: nu înlocuirea expertizei, ci amplificarea ei.

Science Fiction devine realitate

Google a lansat o aplicație web care permite utilizatorilor să creeze și să exploreze lumi generate de AI. Project Genie folosește modelul Genie 3 (prezentat în august) pentru a transforma simple descrieri text în lumi 3D complet explorabile.

Procesul este simplu:

→ Descrii un mediu și un personaj
→ AI-ul generează scena prin Nano Banana Pro și Gemini
→ Explorezi lumea în persoană întâi sau a treia

Personajele pot merge, zbura sau conduce prin medii, iar modelul își amintește ce a construit - când te întorci într-o zonă, aceasta rămâne vizual consistentă.

Totuși, sesiunile sunt limitate la 60 de secunde din cauza costurilor de calcul, și este disponibil doar pentru abonații AI Ultra de la Google.

AI Movies - Hollywood is evolving

Compania AI Primordial Soup a regizorului Darren Aronofsky (regizorul filmelor "Black Swan" și "The Whale"), a lansat "On This Day... 1776", o nouă serie care recreează Revoluția Americană folosind Google DeepMind, fiecare episod apărând la aniversarea de 250 de ani a evenimentului pe care îl descrie.

  • Seria scurt-metraje combină vizuale generate de AI cu actori vocali SAG-AFTRA, poziționându-se ca "AI condus de artiști" și nu complet automatizat.

  • Episoadele sunt lansate pe canalul YouTube TIME, sincronizate cu aniversarea de 250 de ani a fiecărui eveniment descris.

  • Aronofsky s-a asociat cu DeepMind în mai, pentru a colabora la storytelling AI, lansând filmul asistat de Veo ANCESTRA în iunie la Tribeca Film Festival.


AI se infiltrează din ce în ce mai mult în workflow-urile reale ale studiourilor de producție, trecând de la scurtmetraje simple și trucuri ascunse pentru a camufla fețe, la gestionarea întregului proces vizual.
Deși s-ar putea să nu fie încă complet acceptat sau mainstream, sentimentul se schimbă - iar folosirea tehnologiei de către Hollywood, devine din ce în ce mai clară.

Cowork, work, work, work, work

Anthropic a lansat Cowork, un agent pentru desktop integrat în aplicația Claude pentru macOS care poate gestiona fișiere, extrage date și automatiza task-uri - fără să ai nevoie de cunoștințe tehnice.

Îi arăți un folder și Cowork poate:

  • Sorta și redenumi automat fișierele din Downloads

  • Extrage date din screenshot-uri și le transformă în informație structurată

  • Crea spreadsheet-uri și documente din notițe

  • Gestiona task-uri web prin Chrome

  • Automatiza workflow-uri repetitive pe care le faci manual zilnic


Spre deosebire de Claude Code (lansat pentru developeri și coding agentic), Cowork este destinat utilizatorilor obișnuiți care vor să-și automatizeze viața digitală fără să scrie cod.

AI-ul care egalează radiologii profesioniști

Google a lansat actualizări majore la MedGemma 1.5, suite-ul său de instrumente AI medicale open-source, dar și MedASR și MedSigLIP, noi modele AI pentru dictare medicală și imagistică.

Ce este MedGemma?

  • Model multimodal 27B pentru interpretarea imaginilor medicale și dosarelor pacienților

  • MedASR - sistem de recunoaștere vocală optimizat pentru terminologie medicală, capabil să transcrie consultații și notițe clinice cu acuratețe superioară

  • MedSigLIP - instrument specializat pentru analiza imaginilor și textului medical

MedGemma poate analiza:

  • Radiografii toracice

  • Afecțiuni dermatologice

  • Dosare medicale complexe

Modelul 4B atinge 64.4%, iar cel 27B ajunge la 87.7% pe benchmark-ul MedQA, depășind modele de dimensiuni similare

Rapoartele de radiografii generate de MedGemma au fost suficient de precise pentru îngrijirea efectivă a pacienților în 81% din cazuri - egalând calitatea radiologilor umani.

AI makes the beats, human gets the bag

ElevenLabs a lansat un album co-creat cu AI-ul Eleven Music, alături de artiști reali.

ElevenLabs a lansat "For the Culture", primul album colaborativ AI cu 13 piese care acoperă rap, EDM, spoken word și Brazilian funk - iar artiștii păstrează proprietatea completă și toate royalty-urile de la streaming.

Unele piese sunt complet generate de AI, altele combină instrumentale AI cu vocale umane, altele folosesc voci clonate ale artiștilor din marketplace-ul de licențiere ElevenLabs, iar artiștii păstrează 100% din drepturi.


Cu doar un an în urmă, muzica AI era văzută cu furie din partea artiștilor. Acum, acea opoziție începe să pară o minoritate pe măsură ce tehnologia se îmbunătățește și nume mari demonstrează cum AI poate fi un instrument, nu o amenințare.

Really, the last resort?

OpenAI va testa reclame targetate în ChatGPT pentru utilizatorii Free și Go din SUA.

  • Reclamele vor apărea sub răspunsuri ca "Recomandări Sponsorizate", pe baza conversațiilor

  • Acestea vor fi excluse din subiectele de sănătate, politică și pentru utilizatori minori

  • Mișcarea coincide cu lansarea globală a tier-ului ChatGPT Go ($8/lună), care include reclame pentru a compensa prețul mai mic

  • Tier-urile premium (Plus, Pro, Business, Enterprise) rămân fără reclame

  • OpenAI promite că nu va vinde niciodată datele utilizatorilor și nu va lăsa reclamele să influențeze răspunsurile ChatGPT


    Sam Altman spusese în 2024 că reclamele în ChatGPT ar fi "last resort", dar recent a declarat că "nu e total împotrivă" dacă nu încalcă încrederea utilizatorilor.

Getting “Personal”

Google a lansat Personal Intelligence, o funcție beta care permite Gemini să raționeze între aplicații precum Gmail, Photos, YouTube și Search pentru a oferi răspunsuri personalizate - fără să fie nevoie să specifici din ce aplicație să extragă informații.

  • Personal Intelligence conectează suite-ul de aplicații Google la Gemini, permițând asistentului să înțeleagă, localizeze și să folosească proactiv detalii personalizate

  • Poate raționa între text, imagini și video-uri

  • Funcția este oprită implicit, iar Google spune că nu va antrena modelele AI direct pe informații conectate precum inbox-uri sau galerii foto

  • Se lansează pentru abonații Gemini AI Pro și Ultra din SUA mai întâi, cu planuri de extindere către tier-urile gratuite și AI Mode în viitor

Microsoft: “Fine, I'll do it myself”

Microsoft a lansat Maia 200, un nou cip AI propriu, care depășește rivalii de la Amazon și Google la benchmark-uri cheie - atacând în același timp dominația software Nvidia în industrie.

  • Microsoft susține că chip-ul depășește Amazon Trainium 3 și Google TPU v7, cu 30% mai bună eficiență decât hardware-ul său actual

  • Chip-ul va alimenta modelele GPT-o3.2 ale OpenAI, echipele AI interne Microsoft și Copilot în toată gama de produse

  • Microsoft lansează și un preview SDK - tool-uri pentru developers care rivalizează cu software-ul standard din industrie al Nvidia


Google și Amazon deja presau Nvidia să-și croiască o bucată din piața chip-urilor AI, iar acum Microsoft intră în competiție cu propriile chip-uri next-gen.