主题

#安全对齐 · 10 条

7/3 14:2036氪AI61

阿里内部全面禁用Claude Code，因存在植入后门安全风险

据36氪报道，阿里内部人士透露，由于近期Claude Code被曝存在植入后门的安全风险，阿里经综合评估后已将其列入高风险软件名单。自7月10日起，阿里将全面禁止内部员工在办公环境下使用Claude Code，并推荐使用Qoder作为替代方案。

#安全对齐 #政策监管 #行业动态 #编码

7/3 09:19量子位AI47

世界模型新用途：从选手转型裁判，革新AI评估范式

量子位报道指出，世界模型正从传统任务执行者转向评估者角色。这一转变意味着世界模型不再直接参与任务，而是作为裁判或评估工具，用于衡量其他AI系统的性能与行为。该应用有望为AI评测、安全对齐及系统验证提供新的方法论，推动行业在模型评估与监管方面的发展。

#评测基准 #安全对齐 #行业动态 #现象趋势 #Agent

7/3 07:54Hacker News 热帖AI53

Right to Local Intelligence：本地智能权利宣言

Right to Local Intelligence 是一项倡导本地智能权利的运动，旨在推动个人和社区拥有在本地设备上运行人工智能模型的权利，减少对中心化云服务的依赖。该运动强调隐私保护、数据自主和计算主权，鼓励开发者和用户支持开源模型与本地部署方案。目前已在技术社区引发讨论，获得上百点赞和数十条评论，反映出对去中心化AI治理的广泛关注。

#开源生态 #政策监管 #数据训练 #行业动态 #安全对齐

7/3 03:29Hacker News Show独立开发58

Bramble：开源本地优先密码管理器，支持P2P跨设备同步

Bramble是一款开源的本地优先密码管理器，采用P2P跨设备同步技术，无需依赖云端服务器。其同步功能基于Nostr中继（可自托管），设备间通过WebRTC直接传输端到端加密数据，确保密码不会在云端留存。项目已发布Chrome扩展和Android应用，iOS版本正待审核，最新版本还支持全平台通行密钥存储。加密模块使用Rust编写，确保密钥在内存中的安全处理。开发者强调了对云服务商频繁涨价、数据泄露及透明度不足的担忧，旨在提供功能全面、透明可控的替代方案。

#开源仓库 #安全对齐 #部署工程 #独立开发 #产品更新

7/2 21:17Hacker News ShowAI75

开源AI助手Valmis：安全优先的Claude Cowork替代方案

开发者因现有AI助手OpenClaw在API集成与安全性上的不足，创建了开源替代品Valmis。Valmis通过代理系统设计解决安全问题：将AI代理运行在Docker容器中，仅能通过凭证ID请求主机执行API调用，主机完成实际请求后返回JSON数据，此设计甚至允许在断开容器网络访问的情况下工作。目前该系统已支持超过100款商业与生产力应用集成，包括Google Workspace、Slack、Notion等。Valmis还提供自动化工作流功能，支持通过cron、webhook或应用事件触发多步骤工作流，并包含条件与循环控制。

#开源仓库 #Agent #安全对齐 #部署工程 #产品更新

7/2 18:23The Verge AIAI61

OpenAI提议向特朗普政府出让5%股权以缓解AI监管压力

据《金融时报》报道，OpenAI正考虑向美国政府提供5%的股权，以缓和与特朗普政府的紧张关系并应对公众对人工智能日益增长的担忧。CEO Sam Altman认为，让公众获得公司财务利益是分享AI发展红利的最佳方式。该提议最早于去年初向特朗普提出，按OpenAI最新8520亿美元的估值计算，5%股权价值约426亿美元。此举旨在平衡技术创新与政策监管之间的冲突。

#OpenAI #政策监管 #行业动态 #大佬观点 #安全对齐

7/2 11:24爱范儿AI49

Meta 外包测试致 ChatGPT 翻车，安全测试引争议

据报道，ChatGPT 近期出现的一些错误回答，实际上是 Meta 公司委托外包团队进行安全测试的结果。这些测试旨在评估 AI 模型的安全性和鲁棒性，但因其方式引发争议，被指可能干扰正常用户体验。事件揭示了科技公司在 AI 安全测试中的潜在操作，以及外包测试对产品表现的影响。

#OpenAI #Meta #安全对齐 #评测基准 #行业动态

7/2 01:48TechCrunch AIAI82

Cloudflare 新政策要求 AI 公司区分搜索与训练爬虫，否则默认屏蔽

Cloudflare 宣布了一项新政策，要求 AI 公司在 9 月 15 日前将其用于搜索的网页爬虫与用于 AI 训练和智能体的爬虫区分开来。若未遵守，这些爬虫将在许多出版商网站上被默认屏蔽。此举旨在推动 AI 公司为使用出版商内容进行训练付费，保护内容创作者的权益。

#政策监管 #数据训练 #行业动态 #安全对齐

7/1 22:25TechCrunch AIAI70

Venice AI 以6500万美元A轮融资跻身独角兽，隐私优先平台起飞

Venice AI 宣布完成6500万美元的A轮融资，公司估值达到独角兽级别。其CEO Erik Voorhees透露，公司已实现盈利，年化经常性收入超过7000万美元。该平台主打隐私优先的AI服务，目前业务增长迅速。

#行业动态 #产品更新 #安全对齐 #增长 #变现

7/1 05:23Simon WillisonAI85

Claude Sonnet 5 有哪些新特性

Claude Sonnet 5 是 Anthropic 推出的新一代 AI 模型，在推理能力、多模态处理和代码生成等方面均有显著提升。该版本进一步优化了安全对齐机制，并增强了处理复杂任务时的准确性与效率。开发者可通过官方渠道获取更新详情与部署指南。

推荐理由：我认为 Sonnet 5 的推理与代码能力跃升值得每个开发者立刻关注，它可能直接改变你构建 AI 应用的效率与上限，别错过官方部署指南。

#Anthropic #产品更新 #推理 #安全对齐 #部署工程