📢 Gate廣場獨家活動: #PUBLIC创作大赛# 正式開啓!
參與 Gate Launchpool 第 297 期 — PublicAI (PUBLIC),並在 Gate廣場發布你的原創內容,即有機會瓜分 4,000 枚 $PUBLIC 獎勵池!
🎨 活動時間
2025年8月18日 10:00 – 2025年8月22日 16:00 (UTC)
📌 參與方式
在 Gate廣場發布與 PublicAI (PUBLIC) 或當前 Launchpool 活動相關的原創內容
內容需不少於 100 字(可爲分析、教程、創意圖文、測評等)
添加話題: #PUBLIC创作大赛#
帖子需附帶 Launchpool 參與截圖(如質押記錄、領取頁面等)
🏆 獎勵設置(總計 4,000 枚 $PUBLIC)
🥇 一等獎(1名):1,500 $PUBLIC
🥈 二等獎(3名):每人 500 $PUBLIC
🥉 三等獎(5名):每人 200 $PUBLIC
📋 評選標準
內容質量(相關性、清晰度、創意性)
互動熱度(點讚、評論)
含有 Launchpool 參與截圖的帖子將優先考慮
📄 注意事項
所有內容須爲原創,嚴禁抄襲或虛假互動
獲獎用戶需完成 Gate廣場實名認證
Gate 保留本次活動的最終解釋權
蘋果研究人員:主流AI模型仍無法達到AGI期望推理水平
Gate News bot 消息,蘋果研究人員在 6 月份發表的一篇名爲《思考的幻覺》的論文中指出,領先的人工智能 (AGI) 模型在推理方面仍存在困難,因此,開發通用人工智能 (AGI) 的競賽仍任重道遠。
文章指出,主流人工智能大型語言模型 (LLM)(例如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude)的最新更新已包含大型推理模型 (LRM),但其基本功能、擴展特性和局限性“仍未得到充分理解”。
目前的評估主要側重於既定的數學和編碼基準,“強調最終答案的準確性”。然而,研究人員表示,這項評估並未深入了解人工智能模型的推理能力,與通用人工智能僅需幾年就能實現的預期形成了鮮明對比。
研究人員設計了不同的益智遊戲,以超越標準數學基準來測試克勞德·桑奈(Claude Sonnet)、OpenAI 的 o3-mini 和 o1 以及 DeepSeek-R1 和 V3 聊天機器人的“思考”和“非思考”變體。
他們發現,“前沿的邏輯推理模型(LRM)在超過一定復雜度時會面臨準確率的徹底崩潰”,無法有效地泛化推理,而且其優勢會隨着復雜度的上升而消失,這與人們對通用人工智能(AGI)能力的預期相反。
消息來源:Cointelegraph