Kevin Simback

vip
币龄 1.4 年
最高 VIP 等级 0
用户暂无简介
周末是用来建设的……除了今天大部分时间都在清理杂乱的代码
所以我发布了一个我制作的技能,帮你节省一些时间——它是一个命令 /tech-debt-skill
你会得到一份非常详细的审查文件,列出所有需要解决的问题
不仅仅是漏洞和问题,还有那些可以改进或优化的工作
我花了一半的时间在清理 Hermes Atlas,然后对所有已完成的工作进行了审查,将其整合到这个技能中,然后在另一个项目上运行,结果发现了很多问题
在我开始之前,我以为 Claude Code 可能内置一些相关技能,但实际上并没有,尤其是没有从整体角度看待技术债务的功能
所以如果 AI 在进行所有编码工作,并且你在项目中逐步构建,你就会100%积累大量的技术债务——不时使用这个技能来清理它,之后再感谢我吧
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
妻子:“你想要什么作为你的生日礼物?”
我:
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
这就是为什么我每天早上第一件事就启动Claude,通常在早上6点左右
现在只需要等待大约20分钟窗口重置,因为我刚刚离开去送孩子上学和去健身房
如果我等到健身后再开始,在5小时的会话中我会更早达到限制
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
听到很多人说我们“计算受限”,因为这正是我们最近在使用模型时的感受
但问题实际上是从订购GPU到生成令牌之间发生的物理工作
数据中心延迟和取消:
- 还记得星门(Stargate)吗?2025年1月宣布10GW,14个月后上线约200MW,600MW的阿比林(Abilene)扩展 reportedly 被取消
- 宣布的2026年美国AI数据中心容量约16GW,只有约5GW在建
- 预计2026年美国数据中心建设的一半将被推迟或取消,主要原因是缺乏电力
组件短缺:
- 变压器的交货时间现在超过5年,2020年前为24-30个月
- 西门子、通用电气、Vertiv、伊顿都报告了创纪录的积压订单
劳动力短缺:
- 微软报告电工是其数据中心扩展的第一大阻碍
- 北弗吉尼亚的电工人数自2018年以来翻倍,达到14,700人,但仍不够
- 学徒培训需要4-5年
你不得不想象,$700B 在2026年的资本支出如何部署,超大规模云服务商和实验室实际上无法通过花钱来解决这个问题
思考这对未来的影响,其中一个非常明显——本地AI将继续增长,并成为一件大事
STG-0.68%
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
保姆模式——该怎么做?
最近我注意到模型(Claude、GPT、GLM)都似乎更频繁地中途停止完成
它们会暂停,等待我确认,而实际上不应该需要这样
所以我不得不更频繁地“看护”它们,只是为了说“继续”
我相信这是有意为之的行为,是为了在需求激增时进行节流,我理解,但这很烦人
还有其他人也经常遇到这种情况吗?你们用什么工具/提示来避免进入保姆模式?
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
Opus 4.7 今天并不算特别出色
“我的错——我提出了计划并请求批准,但实际上从未写过文件”
“抱歉——我的错,你不用做任何事情”【在它给我一份不合理的待办事项清单之后】
我猜:计算受限
查看原文
post-image
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Hermes Atlas v2 已发布!
> 完整的网站重新设计
> 现在已审查90多个仓库及其原生页面
> 精选流行套件列表
> 新的报告页面,更多内容即将推出
仍在调整中,如果你发现任何问题,请提交问题或在下方回复
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
很明显,Anthropic 正在比其计算能力扩展得更快地扩展产品
我认为这是一件好事——这使得一家公司在通往通用人工智能的竞赛中难以遥遥领先
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
到目前为止,除了我之外,是否还有人对 Opus 4.7 感到失望?
在我得出结论之前,还需要让它做更多的事情,但早期预测并不意味着有很大的提升。
也许我对 Mythos 的期待太高了。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
我在聊天中放入了两个不同的Hermes代理实例,天哪,这太有趣了
>一个代理是构建者,一个是策略师
>每个使用不同的模型
>给它们一些共享的上下文
>启用了bot2bot,并将每个机器人添加到对方的TG白名单
>我们三个人加入了一个群聊
>一开始发了个简单的帖子,让每个确认是否能看到对方的消息
>大约十次握手后,它们就开始自己构建了
有时候你只需要和这些东西FAFO,看看会发生什么,我很确定这会变成一个无限循环,所以可能需要介入一下
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
我目前对人工智能领域的三个超级感兴趣的话题:
1. 本地模型以优化模型使用成本
为什么 -> 我认为我们不会再以每月200美元的几乎无限制使用获得最好的模型了
迹象已经很明显,大型实验室不能再持续补贴
所以趁着Claude Max还在时好好享受,但很快每个公司和高级用户都需要学会如何高效地在不同模型之间切换以完成任务,以及在云端和本地之间切换,而本地是关键
2. 识别代理产品中的护城河
为什么 -> 代理将对世界产生巨大影响,但价值积累不会那么明显
我一直在对此进行大量研究,已经确定了在代理领域形成护城河的五个要素——相关报告即将发布
提示:护城河不是工具本身,而是工具所收集的内容
3. 语境工程作为竞争优势
为什么 -> 在一个智能资源丰富的世界里,语境是创造出比其他人表现更好的结果的关键
不论哪个领域,语境都至关重要,专有数据作为语境就是新的知识产权
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
LLM-wiki 是一个编译的知识库——这很好,且有其用途
但它不是“第二大脑”
LLM-wiki 捕捉了你所研究的内容,也许还包括你阅读的内容
但它没有捕捉你对所读内容的思考,而这正是关键所在
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
有人注意到最近Claude喜欢在完成一些事情后告诉你今天结束了吗?
想知道这是否是一种微妙的方式,让Max计划的用户不再频繁使用它——“让用户觉得自己完成了某事,并鼓励他们停止使用”
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
人们具有竞争性
我们喜欢竞争,也喜欢观看别人竞争,还喜欢对他人竞争的结果下注——这本身也是一种竞争
AI 代理为一种全新的竞争类型开启了设计画布
期待我的代理们参与竞争
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
🚀 想要可以接入OpenClaw或Hermes的免费模型吗?
这里有9个可以免费使用模型API的资源
无需本地设置,无需信用卡,纯云端API,支持OpenAI兼容端点
你还不能获得像Opus那样的免费高质量(但这些都目前提供真正的免费层)可能有速率限制(,如果你不想花钱用代理,已经足够入门
1️⃣ OpenRouter 免费模型
)Gemma 4 31B/26B,NVIDIA Nemotron 3 超级 120B MoE,MiniMax M2.5,Qwen3变体,Llama 4/3.3,gpt-oss-120B,Arcee Trinity等(
• 约29个完全免费的$0/令牌模型
• 丰富多样+顶级开源模型评估)尤其是编码和代理(
• 最适合自动轮换模型
👉 注册:
2️⃣ Google Gemini API
)Gemini 2.5 Pro / Flash系列(
• 最强的免费前沿模型
• 出色的多模态,支持1M+上下文,原生工具调用和代理性能
• 免费额度非常慷慨)经常5–15 RPM(
👉 注册:
3️⃣ NVIDIA
)Nemotron变体,Llama 3.3 70B,Qwen3 235B,Mistral Large等(
• 优化的高性能开源模型
• 免费原型设计层)约40 RPM(
👉 注册:
4️⃣ Grok Cloud
)Llama 4 Scout,Ll
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
雇佣团队成员,而不是工具——这是企业自主智能的未来
大多数公司希望拥有只会做好工作的AI代理——他们不想过多涉及技术细节,如工具的使用和模型的选择
他们只想从菜单中选择一个代理,为该代理配备任何额外所需的技能,然后能够在公司环境中安全地使用它
只需三次点击,代理就可以开始工作,随时启动或关闭都同样方便
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
快速公共服务公告:
如果有人考虑订阅 @Coursiv_io,我强烈建议不要这样做
我有充分的理由相信他们怀有不良意图,简单搜索就会显示许多“诈骗警报”报告
很难过,因为我儿子对此很期待
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
“AI maxxing” 设置:
> 使用家用消费硬件运行最先进的开源模型 ( 多种选项:Mac Mini 64GB,配备 3090/4090/5090 的 PC )
> 使用 Tailscale,或使用与 Tailscale 搭配的 LM Studio 以实现安全的远程访问
> 通过手机/笔记本在任何地方访问模型,进行私密的免费推理
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
对于有雄心的AI研究人员来说,这是一个真正的机会:
- 创建一个测试代理工具(如Openclaw、Hermes及其他“爪”)的评估框架
- 扩展评估到不同的工具/配置,以了解性能如何随着不同设置而变化
- 在不同模型(包括本地与API)之间进行稳健的评估
- 进行基准测试并发布结果,然后随着代理和模型的演变持续更新
这个机会是成为客观代理基准的首选来源
也许有人已经在做这件事,我还没有意识到?不是一次性的比较,而是真正的标准测试和评估,让我们能够真正比较结果
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享