OpenAI推GDPval标准，量化AI经济贡献

每日早报
9月29日
编辑

智选跨境跨境领航员

OpenAI推出了一套名为GDPval的新评估体系，旨在衡量先进AI模型在真实经济工作中的实际能力，弥补传统学术测试与现实应用之间的差距。该体系覆盖美国九大关键行业的44种职业，包含1320项由资深从业者设计的具体任务，要求AI完成报告、文件、演示文稿等实用产出，更贴近真实职场需求。
首次测试显示，Claude Opus 4.1整体表现最佳，而GPT-5在专业内容的准确性方面表现更优。研究发现，当前最先进的AI完成任务的速度约为人类的100倍，成本仅为人工的1%。目前该评估体系尚未包含需要多轮反馈或深度交互的复杂任务，未来将逐步扩展测试范围，并计划开放部分数据供外部研究使用。

{{userData.name}}已认证

苹果手机配置TikTok环境保姆级教程

TikTok官方账户0粉实名

TikTok账户店铺0粉实名

TikTok橱窗号实名

TikTok for Shopify操作指南与常见问题

美国卖家短视频内容优化指南

如何管理美国本土店铺产品评级

美国本土店铺产品列表优化指南

短视频广告投流方法及投放策略

商品类目从3级拓展至4-7级

【优化商品质量】发品质量分级说明

如何在TikTokShop卖家中心处理恶意评价？

通过ADS广告提升您的直播

通过ADS广告提升您的视频

促销优惠券用于 EC 短视频和 EC 直播

Shop Ads（商店广告）入驻指南

东南亚跨境卖家拆包发货指南

东南亚跨境物流如何拦截包裹？

备货仓商家如何高效入仓

东南亚平台跨境物流运费须知

小型SKU包装指南

包装和标签的注意事项

卖家责任取消率 (SFCR)

延迟发货率 (LDR)

OpenAI推GDPval标准，量化AI经济贡献

欧洲九家银行将推欧元稳定币，实现全天候跨境支付

越南拟修法要求外资电商设本地法人并缴保证金

如何将多个订单合并为一个包裹？

羽绒代工之王Youngone：年产2亿件服务始祖鸟/北面等顶级品牌

俄罗斯西线现历史最严重拥堵，7500辆车滞留迫使卖家转向东线

外贸人必看：Kakao Talk注册使用全攻略及常见问题

东南亚跨境商家入驻操作指南

新手也能赚！Instagram 广告投放与变现完整指南

关于智选跨境

产品矩阵

支持与服务

关注交流

{{userData.name}}已认证

相关文章：