• Sigmoid
  • Posts
  • The easy way to stay ahead of new tech and AI news

The easy way to stay ahead of new tech and AI news

Your monthly rundown on where AI, tech and trends are moving.

Howdy Dragi Sigmariteni

Vrei să afli care sunt cele mai noi inovații de la OpenAI, Deepseek sau xAI, cum AI poate transcrie textul în mai multe limbi sau genera imagini, cod sau video? Cum AlphaGeometry 2 rezolvă problemele de la olimpiada la matematică sau cum un dispozitiv AI poate să îți citească gândurile? Fie că sunteți pasionați de tehnologie sau lucrați în domeniul AI, acest newsletter vă oferă informațiile esențiale pentru a rămâne la curent cu cele mai interesante dezvoltări din industrie.

Cum Grok 3 redefinește capacitățile AI? Descoperă noutățile de la xAI și Elon Musk

xAI a lansat Grok AI, propriul model în noua lor aplicație, în cadrul unui eveniment transmis în direct cu Elon Musk. Grok 3 este considerat de zece ori mai capabil decât Grok 2 și este antrenat pe 200.000 de GPU-uri Nvidia H100. Modelul Grok 3 include funcționalități avansate de raționament, matematică, codare și cunoștințe generale, fiind capabil să imite raționamentul uman. Grok 3 este disponibil inițial pentru abonații X Premium Plus și va fi lansat ulterior printr-un serviciu de abonament separat numit SuperGrok. Modelul include o funcție numită DeepSearch, care scanează internetul și platforma X (fostul Twitter) pentru a oferi rezumate concise ale întrebărilor de cercetare. De asemenea, Grok 3 va avea un mod vocal, permițând utilizatorilor să converseze cu AI-ul folosind voci sintetizate. Familia Grok, incluzând Grok 3 și Grok 3 mini, analizează imagini și răspunde la întrebări, având performanțe superioare în benchmark-uri precum AIME și GPQA. Modelele Grok 3 Reasoning și Grok 3 mini Reasoning sunt specializate în raționament, capabile să rezolve probleme complexe printr-un proces logic pas cu pas. Grok 3 este disponibil inițial pentru abonații X Premium Plus și va fi lansat ulterior prin abonamentul SuperGrok, toate modelele fiind accesibile prin aplicația Grok pentru soluții de cercetare și producție la nivel enterprise.

Poate Operator de la OpenAI să fie noul tău Browser Assistant?

OpenAI a lansat Operator, un agent AI care poate controla un web browser și poate face anumite simple sarcini în locul tău, precum shopping-ul. Acesta este disponibil utilizatorilor Pro și, mai târziu, va fi disponibil și celor Team, Plus și Enterprise. Operator utilizează modelul Computer-Using Agent (CUA), care combină capabilitățile de viziune ale GPT-4o cu raționamentul avansat al unui model OpenAI nedezvăluit. Operator poate naviga pe web, completa formulare și efectua diverse acțiuni folosind un browser dedicat. În prezent, Operator este disponibil pentru utilizatorii Pro din Statele Unite și va fi extins în alte țări și pentru alte planuri de abonament în viitor.

Janus-Pro-7B: Noul Model de generare a imaginilor de la DeepSeek

Compania chineză DeepSeek a lansat Janus-Pro-7B, un nou model de generare a imaginilor open-source. Janus-Pro-7B este un model AI multimodal revoluționar, care integrează capacități avansate de generare a imaginilor și înțelegere vizuală. Acesta depășește performanțele modelului DALL-E 3, obținând o acuratețe de 84,2% în testele DPG-Bench și 80,0% în GenEval. Modelul este disponibil în două versiuni, 1B și 7B, pentru o implementare flexibilă. Janus-Pro-7B utilizează o arhitectură inovatoare cu două căi și un sistem de procesare unificat, oferind soluții de nivel enterprise pentru cercetare și producție.

Omi: Dispozitivul AI care îți citește gândurile

Un nou device numit omi, care "îți poate citi gândurile," a fost lansat. Omi este un dispozitiv AI portabil inovator care se poartă pe frunte sau la gât și poate citi gândurile utilizatorilor pentru a îndeplini sarcinile înainte ca acestea să fie exprimate verbal. De asemenea, poate asculta conversațiile și oferi informații pentru a ajuta utilizatorii să răspundă, dacă este necesar. Dispozitivul se conectează la smartphone-uri printr-o aplicație dedicată, iar datele și conversațiile pot fi stocate local pe telefon sau în cloud, cu opțiunea de a le șterge cu un singur clic. Omi funcționează pe o platformă open-source, permițând dezvoltatorilor să creeze propriile aplicații și să integreze modele AI personalizate. Lansarea unui modul de interfață creier-computer este planificată pentru trimestrul 2 din 2025, ceea ce va oferi capabilități avansate de citire a gândurilor.

Qwen2.5 de la Alibaba - următorul pas în evoluția AI pentru codare și matematică

Echipa Qwen a companiei chineze Alibaba a lansat familia de modele Qwen2.5, după ce rivalul acesteia, DeepSeek, a lansat mai multe modele în ultima perioadă. Printre noile capabilități ale Qwen se numără și opțiunea de a controla propriul calculator sau telefon. Modelele Qwen2.5 includ variante specializate pentru codare și matematică, precum Qwen2.5-Coder și Qwen2.5-Math. Aceste modele sunt dense, de tip decoder-only, și sunt disponibile în diverse dimensiuni, de la 0.5B la 72B. Modelele Qwen2.5 sunt pre-antrenate pe un set de date de mare amploare, cu până la 18 trilioane de tokeni, și oferă suport multilingv pentru peste 29 de limbi. De asemenea, modelele Qwen2.5 sunt mai rezistente la diversitatea prompt-urilor de sistem, îmbunătățind implementarea rolurilor și setarea condițiilor pentru chatbots.

AI Dev Conference 2025

DeepLearning.AI, împreună cu Andrew Ng, au anunțat AI Dev Conference 25, care va avea loc pe 14 martie 2025, la San Francisco. Acest eveniment de o zi va reuni peste 400 de dezvoltatori de top în domeniul AI pentru a împărtăși cunoștințe, a prezenta inovații și a crea rețele de contacte. Conferința va include prezentări principale de la personalități de renume, discuții interactive pe paneluri despre cele mai recente tendințe și provocări în dezvoltarea AI, ateliere tehnice detaliate conduse de lideri și dezvoltatori AI de la companii precum OpenAI, LangChain, Meta, crewAI și GCP. De asemenea, vor fi demonstrații live ale aplicațiilor AI de ultimă generație și sesiuni de networking, inclusiv o oră de socializare.

Care sunt noile inovații de la OpenAI?

OpenAI a lansat noul lor model o3-mini, care poate oferi aceeași performanță ca modelul o1, dar la un preț mai redus. o3-mini este optimizat pentru sarcini de raționament, codare, matematică și știință, oferind performanțe rapide și latență redusă. Modelul include funcționalități avansate, cum ar fi Structured Outputs, function calling și developer messages. Utilizatorii pot ajusta nivelul de raționament între low, medium și high, în funcție de nevoile lor specifice. o3-mini este disponibil pentru utilizatorii ChatGPT Plus, Team și Pro, iar accesul pentru utilizatorii Enterprise va fi disponibil în curând.

De asemenea, OpenAI a lansat Deep Search, un nou feature al modelelor sale, care îi permite să caute informații pe web, să le analizeze și să le sintetizeze în doar câteva zeci de minute - un lucru care ar lua unei persoane câteva ore. Acesta este disponibil doar pentru utilizatorii Pro și va fi disponibil utilizatorilor Plus și Team mai târziu. Deep Search utilizează modelul OpenAI o3, optimizat pentru navigarea pe web și analiza datelor, și poate efectua cercetări complexe, multi-etapă, pe internet. Acesta este ideal pentru sarcini de lucru intense în domenii precum finanțe, știință, politică și inginerie, oferind rapoarte documentate și citate clar.

Creează evenimente și invitații personalizate cu Apple Invites

Noua aplicație Apple Invites de la Apple îți permite să creezi evenimente și să oferi invitații într-un mod simplu, folosind instrumente precum Image Generation sau Writing Tools. Apple Invites permite utilizatorilor să personalizeze invitațiile cu imagini din biblioteca foto sau dintr-o galerie de fundaluri tematice. Aplicația integrează hărți și prognoze meteo pentru a oferi invitaților direcții și informații despre vreme. Utilizatorii pot contribui cu fotografii și videoclipuri într-un album partajat dedicat fiecărui eveniment și pot crea playlisturi colaborative prin Apple Music. Invitațiile pot fi partajate printr-un link și invitații pot răspunde chiar dacă nu au un cont Apple.

Agent Mode GitHub Copilot pentru eficiență sporită prin automatizarea codului

GitHub a lansat GitHub Copilot Agent Mode, un nou feature al Copilot care îți permite să folosești agenți AI pentru a scrie cod și a rezolva automat erorile din acesta. Agent Mode automatizează sarcinile repetitive de codare și rezolvă erorile de runtime în mod autonom, folosind capabilități de auto-vindecare pentru a îmbunătăți productivitatea. Acesta permite editarea codului pe mai multe fișiere prin comenzi în limbaj natural, simplificând implementarea modificărilor la nivel de proiect. Agent Mode este disponibil prin GitHub Copilot Chat în Visual Studio Code Insiders și include sugestii de comenzi terminale pentru a accelera fluxurile de lucru.

Conectează-te cu cele mai promițătoare tech startups din Moldova într-un singur loc, într-o singură zi

Startup Moldova Summit is BACK! Pe 16 aprilie 2025, la Digital Park, comunitatea tech din Moldova se va reuni pentru cea mai importantă conferință dedicată inovației și antreprenoriatului. Startup Moldova Summit continuă tradiția de a conecta startup-urile locale cu experți internaționali, investitori de capital de risc și organizații de suport. Acest eveniment este o oportunitate fantastică de a face networking cu lideri din industrie, de a te inspira de la experți globali și de a te conecta cu investitori și parteneri strategici. Nu rata această șansă de a-ți duce startup-ul la următorul nivel!

Ești pasionat de matematică? Folosește AlphaGeometry 2 pentru a te pregăti de olimpiadă

Google DeepMind a dezvoltat AlphaGeometry 2, un nou model AI capabil să rezolve 84% dintre problemele din cadrul olimpiadelor de matematică din ultimii 25 de ani. AlphaGeometry 2 combină puterea predictivă a unui model de limbaj neural cu un motor de deducție bazat pe reguli, lucrând împreună pentru a găsi soluții la probleme complexe de geometrie. Modelul a fost antrenat pe un set vast de date sintetice, generând 100 de milioane de exemple unice fără demonstrații umane. AlphaGeometry 2 a obținut performanțe remarcabile, rezolvând patru din cele șase probleme de la Olimpiada Internațională de Matematică din 2024, atingând nivelul unei medalii de argint.

Side-by-side comparison of AlphaGeometry proof versus human proof on the IMO 2004 P

Noul model de generare a imaginilor open-source - Goku

ByteDance a lansat un nou model de generare a imaginilor open-source, numit Goku. Goku este un model AI multimodal avansat, capabil să genereze atât imagini, cât și videoclipuri de înaltă calitate. Acesta utilizează tehnici de transformare a fluxului rectificat pentru a îmbunătăți interacțiunea dintre tokenii de imagine și video. Goku suportă multiple sarcini de generare, inclusiv generarea de text-în-video, imagine-în-video și text-în-imagine. Modelul a obținut scoruri impresionante pe principalele benchmark-uri, inclusiv 0.76 pe GenEval pentru generarea de text-în-imagine și 84.85 pe VBench pentru generarea de text-în-video.

Modelul AI de la Figure AI care transformă roboții umanoizi

Helix, noul model AI dezvoltat de Figure AI, permite roboților umanoizi să efectueze sarcini complexe în mod autonom. Helix este un model Vision-Language-Action (VLA) care integrează percepția vizuală, înțelegerea limbajului și execuția acțiunilor într-o singură rețea neurală. Acest model revoluționar permite roboților să recunoască obiecte, să interpreteze comenzile în limbaj natural și să execute sarcini complexe fără a necesita programare sau ajustări specifice. Helix este capabil să colaboreze cu alți roboți și să manipuleze obiecte necunoscute anterior, fiind ideal pentru aplicații industriale, casnice și colaborative. De asemenea, Helix funcționează pe GPU-uri cu consum redus de energie, făcându-l eficient și scalabil pentru diverse platforme robotice.

Cum poți transcrie textul în mai multe limbi simultan?

Deepgram a lansat Nova-3, primul model speech-to-text dedicat transcrierii multilingve în timp real. Nova-3 este un model AI avansat care oferă transcriere precisă în timp real, chiar și în medii acustice dificile, cum ar fi controlul traficului aerian, drive-thru-uri și centre de apeluri. Modelul permite personalizarea automată a vocabularului pentru domenii specifice, fără a necesita expertiză profundă în învățarea automată. Nova-3 suportă transcrierea în mai multe limbi simultan și oferă recunoaștere precisă a terminologiei specifice pentru domenii precum medical și juridic. De asemenea, modelul include capabilități avansate de gestionare a datelor, cum ar fi redactarea în timp real a informațiilor sensibile pentru conformitate și confidențialitate.

Primul procesor cuantic de la Microsoft

După 17 ani de cercetări, Microsoft a dezvăluit primul său procesor cuantic, Majorana 1, ce prevede un progres major în calculul cuantic. Majorana 1 este primul procesor cuantic din lume bazat pe o arhitectură de tip Topological Core, utilizând un material revoluționar numit topoconductor. Acest procesor poate găzdui până la un milion de qubiți pe un singur cip, oferind o scalabilitate fără precedent. Majorana 1 utilizează particule Majorana pentru a crea qubiți mai stabili și mai fiabili, permițând calculatoarelor cuantice să rezolve probleme industriale complexe în ani, nu decenii.

Cum poți identifica tipare genetice și prezice mutații cu AI?

Evo 2, dezvoltat de NVIDIA, este cel mai mare model AI în biologie care poate identifica tipare genetice și prezice mutații cu precizie. Evo 2 a fost antrenat pe un set vast de date, incluzând 128.000 de genomuri din toate domeniile vieții, de la oameni la bacterii și archaea. Modelul poate genera secvențe de ADN și ARN, prezice efectele mutațiilor asupra proteinelor și organismelor, și poate crea noi structuri moleculare, cum ar fi complexe CRISPR-Cas. Evo 2 este disponibil pentru cercetători prin platforma NVIDIA BioNeMo și poate fi utilizat pentru descoperiri în domenii precum biotehnologia industrială, medicina și științele mediului.

Don't miss the latest from Sigmoid!

Ești pasionat de inteligența artificială și vrei să afli cele mai actuale știri? Alătură-te canalului de Telegram Sigmoid pentru a primi cele mai noi și relevante informații din lumea tehnologiei și a AI. Rămâi conectat cu actualizări rapide și oportunități unice. Abonează-te acum și fii mereu la curent!