分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

Explore Web3 Giveaway for more exciting rewards

トレンドトピック

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-10%

Boopa+2.41%

PORK-2.47%

Daniel Kang

UIUC CSの助教授。以前はスタンフォードDAWNラボとバークレースカイラボに所属。

Daniel Kang8月12日 01:27

コンピューティングはフロンティアAIトレーニングにとって最も重要な要素であるというのが一般的な知恵です。データはAIトレーニングの最もコストがかかり、重要な要素です。主要なデータラベリング会社の収益の推定値を収集し、2024年のトップモデルをトレーニングするための限界コンピューティングコストと比較しました。私たちの推定では、データのラベル付けは限界トレーニング計算よりも~3倍高いことが示されています。 1/8

146.41K

Daniel Kang8月5日 05:23

バークレーAgentXサミットでベンチマークと評価トラックで1位を獲得しました!チームの:)、おめでとうございます

Daniel Kang2025年7月9日

AI エージェントが現実世界で使用されるのに近い場合、実際に何ができるかをどうやって知ることができるのでしょうか?信頼できるベンチマークは重要ですが、エージェントのベンチマークは破られます。例: WebArena は、期間計算タスクで「45+8 分」を正解としてマークします (実際の答え: 「63 分」)。他のベンチマークでは、エージェントの能力が1.6〜100%誤って推定されています。エージェントシステムの評価基盤が脆弱なのはなぜですか?スレッドとリンクについては以下を参照してください 1/8

1.09K

Daniel Kang2025年7月29日

時間通りに投稿するのが苦手!(言い訳は、今年もアディス・コーダーで教えているからです) この論文のポスターセッションは今開催中です! セッション5:Vギャザー検索 2025/7/28 18:00-19:30 @ChuxuanHu :)に挨拶

Daniel Kang2025年7月29日

AI エージェントは研究結果の再現性を評価できますか? 私たちの #ACL2025 論文では、112 の論文、完全な PDF、コード、およびデータの実際の社会科学の再現性タスクでエージェントを評価する新しいベンチマークである REPRO-Bench では不十分であることが示されています。最もパフォーマンスの高いエージェントのスコアは<40%です。 1/6

2.79K

Daniel Kang2025年7月29日

6.78K

Daniel Kang2025年7月23日

SWE-bench Verified は、コーディングエージェントを評価するためのゴールドスタンダードです: 500 の現実世界の問題 + OpenAI によるテスト。防弾のように聞こえますか?まだまだです。単体テストに合格することを示します != グラウンドトゥルースに一致します。ACLの論文では、エージェントの24%がリーダーボードを上下に上げたというバグのある評価を修正しました。 1/7

25.05K

Daniel Kang2025年6月26日

強化学習により、LLMはプログラミング/数学の競争で人間を打ち負かすことができ、最近の進歩を推進しています(OpenAIのoシリーズ、AnthropicのClaude 4) RL は、事前学習と同じように広範な一般化を可能にするのでしょうか?現在の技術では違います 🧵 1月7日

2.77K

Daniel Kang2025年6月24日

SIGMODのポスターセッション2(水曜日16:00、ポツダムII)で発表します。挨拶に来てください!

Daniel Kang2025年6月24日

近似クエリ処理 (AQP) は、実行時間の長い分析クエリを桁違いに高速化できます。しかし、なぜAQPはまだ生産が少ないのでしょうか? これに対処するために、DBMS に変更を 0 し、アプリオリエラー保証で結果を提供し、最大 126 倍の高速化を実現するオンライン AQP ミドルである PilotDB を開発しました。 1/8

828

Daniel Kang2025年6月24日

1.72K

Daniel Kang2025年4月29日

@ZhanQiusi1は、水曜日の午前11時のポスターセッションと土曜日のTrustNLPワークショップ(スポットライトトーク)で私たちの作品を発表します!彼女を見かけたら挨拶してください

Daniel Kang2025年3月13日

AIエージェント(OpenAIのオペレーターなど)はますます人気が高まっていますが、ユーザーに危害を加えるために攻撃される可能性があります。防御策を講じても、AI エージェントは「適応型攻撃」による間接的なプロンプトインジェクションによって侵害される可能性があることを NAACL 2025 の調査結果の論文で示しています 🧵 および以下のリンク

266

Daniel Kang2025年4月20日

今年は #ICLR2025 にいます!Alignment Workshopでの講演とML Safety Socialでのパネルセッションを行います。私を見かけたら挨拶してください

773

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable