Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Tämä Stanfordin essee räjäytti tajuntani 🤯
He julkaisivat artikkelin, jossa he heittivät 10 ammattimaista pentestaria reaaliaikaiseen yliopistoverkkoon, 8 000 oikeaa konetta, 12 aliverkkoa, tuotantojärjestelmiä, oikeita käyttäjiä ja päästivät sitten tekoälyagentteja samaan ympäristöön nähdäkseen, kuka oikeasti löytää enemmän haavoittuvuuksia.
Eikä se ollut edes lähellä.
Heidän uusi agenttinsa, ARTEMIS, astui tähän valtavaan, sotkuiseen, simuloimattomaan ympäristöön ja voitti yhdeksän kymmenestä ihmisasiantuntijasta.
Ei CTF:ssä.
Ei staattisilla CVE:illä.
Ei leluvertailussa.
Todellisessa yritysverkossa, jolla on todellisia seurauksia.
ARTEMIS löysi 9 validoitua haavoittuvuutta, ylläpiti 82 %:n hyväksytyn lähetysprosentin ja sijoittui koko tulostaululla sijalle #2 ilman valvontaa, ilman räätälöityjä hyökkäyksiä ja 18 dollarin tuntikustannuksella.
Ihmispentestaaja saa keskimäärin ~60 dollaria tunnissa.
Tässä on se hullu osa:
• Ihmisten piti valita kohteet manuaalisesti
• ARTEMIS synnytti aliagentteja ja hyökkäsi useisiin isäntiin rinnakkain
• Ihmiset unohtivat johtolankoja tai jäivät jumiin kaninkoloihin
• ARTEMIS säilytti täydellisen muistin TODO-listoilla + automaattisella triagella
• Ihmiset eivät pystyneet lataamaan vanhentuneita IDRAC-verkkoliittymiä
• ARTEMIS sivuutti selaimen ja hyödynsi niitä curl -k
Se löysi jopa haavoittuvuuksia, joita yksikään ihminen ei löytänyt.
Ainoat asiat, jotka hidastivat sitä?
GUI-pohjaiset hyökkäykset ja korkeampi väärien positiivisten todennäköisyys.
Kaikki muu? Se toimi kuin täysin miehitetty punainen tiimi, jolla oli ääretön kärsivällisyys ja nolla egoa.
Tämä on hetki, jolloin hyökkäysturvallisuus muuttuu pysyvästi:
Tekoäly ei enää auta pelkästään pentestaajia.
Tekoäly kilpailee nyt heidän kanssaan ja joissain tapauksissa voittaa heidät.
Artikkeli: Tekoälyagenttien vertailu kyberturvallisuusalan ammattilaisiin todellisessa tunkeutumistestauksessa

1,6K
🔥 En voi uskoa, että tämä on olemassa... Joku on vihdoin kirjoittanut salaisen pelikirjan, jota jokainen tekoälyagenttistartup on feikannut.
Tutkimusryhmä julkaisi juuri "Käytännön oppaan tuotantotason agenttitekoälytyönkulkujen suunnitteluun, kehittämiseen ja käyttöönottoon", ja se on käytännössä se sisäinen käsikirja, jota ihmiset *ajattelevat* käyttävän* OpenAI:ta ja Anthropicia.
Ei hypeä.
Ei kaavioita, joissa on söpöjä nuolia.
Todellinen insinöörisuunnitelma agenteille, jotka eivät romahda heti, kun poistut demohiekkalaatikosta.
Tässä on se, mikä tekee siitä hullun 👇
1 / He aloittavat paljastamalla, miksi useimmat agentit romahtavat
Se ei koskaan ole malli.
Kyse on sen ympärillä olevasta järjestelmästä:
• epädeterministinen työkalureititys
• hiljaiset MCP-viat
• agentit improvisoivat täytäntöönpanomääräyksen
• työnkulut, jotka tuottavat erilaisia tuloksia jokaisella ajokerralla
Ne osoittavat raakaa vikaantumisjälkiä — todellisia lokikirjoja agenteista, jotka ampuvat väärin, kiertävät tai harhailevat työkaluja.
Se muistuttaa ruumiinavausta jokaisesta "autonomisen tekoälyn työntekijän" demosta.
2 / He rakentavat koko pinon uudelleen determinismin ympärille
Jokainen työkalukutsu muuttuu tyypityksi funktioksi.
Jokainen suorituspolku on uudelleenpelattavissa.
Jokainen askel on deterministinen.
Jos järjestelmä ei pysty tuottamaan samaa tuotosta kahdesti, se ei ole tuotantotasoista.
Tämä sääntö yksinään tappaa puolet kaaoksesta, jota ihmiset luulevat "emergenceksi".
3 / He valvovat yksivastuuisia agentteja
Ei mega-agenttia, jolla olisi 12 persoonaa.
Sen sijaan:
•suunnittelija
• päättelyväline
• työkalun suorittaja
• validointi
•syntetisaattori
Jokaisella on tiukat rajat.
Ei hallusinoituja työkaluja.
Ei sekalaista ajattelua.
Ei freelance-töitä.
Tämä on taustatekniikkaa, ei roolipelaamista.
4 / He ulkoistavat jokaisen kehotteen kuten oikean konfiguroinnin
Kehotteet eivät ole enää piilotettuja merkkijonoja — ne ovat:
• versio-ohjattu
• auditoitavissa
• diffable
• ladattava
Tämä luo vakaan käyttäytymisen ja estää näkymättömiä regressioita.
5 / He pyörittävät mallikonsortiota tuomarin kanssa
GPT + Claude + Gemini eivät ole vaihdettavissa keskenään.
He ovat yhteistyökumppaneita.
Jokainen tuottaa luonnoksen.
Päättelytoimija yhdistää ne, ratkaisee ristiriidat ja tuottaa yhtenäisen tuloksen.
Rakenteellista väittelyä, ei mallirulettia.
6 / Ne irrottavat työnkulkumoottorin MCP-kerroksesta
Ne erottuvat:
•orkestrointi
• työkalujen käyttö
•Uudelleenyhdistämisyritykset
• terveystarkastukset
•skaalaus
• havaittavuus
Tulos: agenttijärjestelmä, joka käyttäytyy kuin mikropalvelut, ei teipetetty chat-makro.
7 / Sitten he todistavat kaiken todellisella tuotantoputkella
Täysi uutinen ➝ analyysi ➝ skripti ➝ päättely ➝ ääni ➝ video ➝ GitHub PR-järjestelmä.
Täydelliset kaaviot.
Täydelliset jäljet.
Todellisia epäonnistumisia.
Varsinaisia korjauksia.
Se on lähimpänä tämän alan kanonista arkkitehtuuria agenteille, jotka kestävät todellisen maailman kuormituksen.
Jos agenttipinossasi ei ole:
• deterministiset työnkulut
• erilliset vastuut
• ulkoiset kehotteet
• monimallinen välimiesmenettely
• oikea infra
• täysi havaittavuus
… Et rakenna.
Rakennat demoja.
Tämä opas on ensimmäinen todellinen pohjapiirros tuotanto-AI-järjestelmistä ja nostaa rimaa kaikille.

28,72K
Voi helvetti... tämä artikkeli saattaa olla tärkein muutos siinä, miten käytämme LLM:iä koko vuonna.
"Suuret kausaalimallit suurista kielimalleista."
Se osoittaa, että voit kasvattaa kokonaisia kausaalisia malleja suoraan LLM:stä, ei approksimaatioista, ei fiilikoista, todellisista kausaalisista graamuista, vastafaktuuksista, interventioista ja rajoittetuista rakenteista.
Ja tapa, jolla he sen tekevät, on villi:
Sen sijaan, että kouluttaisivat erikoistunutta kausaalista mallia, he kyseenalaistavat LLM:ää kuin tiedemies:
→ poimia ehdokaskausaalinen graafi tekstistä
→ pyytää mallia tarkistamaan ehdolliset riippumattomuudet
→ havaitsevat ristiriitoja
→ uudistaa rakennetta
→ testaa vastafaktuuksia ja interventioennusteita
→ toistaa, kunnes kausaalinen malli vakautuu
Tulos on jotain, mitä emme ole koskaan ennen kokeneet:
kausaalinen järjestelmä, joka on rakennettu LLM:n sisällä käyttäen omaa piilevää maailmantietämystä.
Vertailuarvojen välillä synteettisissä, todellisessa maailmassa, sotkuisilla alueilla nämä LCM:t päihittävät klassiset kausaalisen löytämisen menetelmät, koska ne hyödyntävät LLM:n valtavaa aiempaa tietämystä pelkkien paikallisten korrelaatioiden sijaan.
Entä vastakkainen perustelu?
Yllättävän vahva.
Malli voi vastata "entä jos" -kysymyksiin, joissa standardialgoritmit epäonnistuvat täysin, yksinkertaisesti siksi, että se jo "tietää" asioita maailmasta, joita algoritmit eivät pysty päättelemään pelkästään datasta.
Tämä artikkeli vihjaa tulevaisuudesta, jossa LLM:t eivät ole pelkkiä mallikoneita.
Niistä tulee kausaalisia moottoreita, järjestelmiä, jotka muodostavat, testaavat ja tarkentavat rakenteellisia selityksiä todellisuudesta.
Jos tämä skaalautuu, jokainen kausaaliseen päättelyyn perustuva ala – taloustiede, lääketiede, politiikka ja tiede – kirjoitetaan uudelleen.
LLM:t eivät vain kerro, mitä tapahtuu.
He kertovat miksi.

42,23K
Johtavat
Rankkaus
Suosikit
