- 分类:
- 人工智能
-
- 【大模型后训练学习】DPO与GRPO专题学习
- 前言✍前面几章我们已经把“大模型架构四件套”(GQA/RoPE/SwiGLU/RMSNorm)和DeepSeek系列摸了个大概,知道了一个LLM从参数形状到注意力细节是怎么设计的。但在实际工程项目中,当我们直接丢给用户一个“只做next-tokenprediction的预训练模型”,它大概率会:胡说八道(hallucination)、不听指令,答非所问、安全性、价值观、风格都不可控。为了让模型的输出更加符合我们的需求,InstrcutGPT提出了人类偏好训练(RLHF),在【大
- 人工智能 . 科技周边 789 2025-11-26 16:56:02
-
- 【大模型学习】现代大模型架构(二):旋转位置编码和SwiGLU
- RoPE/SwiGLU前言✍上一篇我们把现代大模型的两件“基础设施”——GQA注意力和RMSNorm+Pre-Norm细讲了一遍,从多头注意力的演化一路讲到归一化的升级。这一篇,我们就顺势把剩下的两件标配武器补上:RoPE(RotaryPositionalEmbedding):解决“长上下文+相对位置建模”的问题;SwiGLU前馈网络:解决“FFN表达力与训练稳定性”的问题。一、位置编码1.1绝对位置编码——三角函数编码在最早的Transformer里,模型本身对“顺序
- 人工智能 . 科技周边 973 2025-11-26 16:50:02
-
- Claude Opus 4.5 发布即登顶 智能体能力遥遥领先
- 近日,Anthropic正式发布了其最新一代旗舰AI模型——ClaudeOpus4.5。这款被定义为通用人工智能领域领头羊的新系统,在编码能力、智能体协同以及计算机操作等维度实现了前所未有的突破,尤其在深度研究分析、复杂演示文稿处理和电子表格任务方面,展现出跨代际的进化。据官方公布的技术资料,ClaudeOpus4.5的推出远非简单的参数扩张,而是标志着人机协作模式即将迎来结构性变革。在软件工程专项测评中,该模型已达到当前行业顶尖水准。为验证其真实表现,Anthropic内部进行了一
- 人工智能 . 科技周边 971 2025-11-26 16:44:21
-
- 强化学习系列(十二)--GRPO,DAPO,DUPO,GSPO
- 在之前的强化学习系列中我们介绍了强化学习的基础知识,也在系列十和系列十一中介绍了强化学习RL在LLM中的应用。最近我在介绍DeepResearchAgent的论文分享中讨论过从高质量数据合成,Agentic增量预训练(CPT),有监督微调(SFT)冷启动,到强化学习(RL)全流程的方法。但是介绍过程中重点在数据和论文方案思路框架上,RL算法部分都略过了。因为我发现每篇论文都在使用不同的RL方法,每个都详细介绍篇幅太长,不如将这些RL方法单独做一篇详细聊聊。PPO在LLM的应用就不用再介绍了,系列
- 人工智能 . 科技周边 259 2025-11-26 16:42:43
-
- 【多模态大模型面经】 BERT 专题面经
- ✍本专题假设读者已经具备一定的深度学习与Transformer基础,目标是帮助读者系统地复习BERT模型的核心设计思想与常见面试问法。本专题来源于本人在面试NLP/LLM/多模态预训练相关岗位时的真实问题与个人总结,本章的重点是为什么GPT的【MASK】设计会导致数据泄露?为什么BERT在取代【MASK】保留原词的时候就不会导致数据泄露?等比较深入的问题一、BERT基本架构BERT全称为BidirectionalEncoderRepresentationsfromTran
- 人工智能 . 科技周边 402 2025-11-26 16:42:29
-
- CentOS 7 内核升级指南:解决兼容性问题并提升性能
- CentOS7默认使用的3.10.x内核版本虽然具备良好的稳定性,但随着软硬件技术不断演进,逐渐暴露出一些局限性:硬件支持不足:难以识别新型CPU、GPU或存储设备,缺乏相应驱动。功能缺失:不支持Cgroupsv2、Btrfs文件系统等现代特性。性能限制:旧版调度机制和网络栈在高负载场景下效率偏低。将内核升级至4.x或更高版本可有效缓解上述问题。本文介绍两种主流升级方式——通过ELRepo仓库自动安装和手动RPM包部署,并涵盖升级后的验证、回滚及长期维护策略。一、
- 人工智能 . 科技周边 480 2025-11-26 16:39:06
-
- AI赋能项目管理:工具如何重塑效率边界
- {\"type\":\"doc\",\"content\":[{\"type\":\"heading\",\"attrs\":{\"id\":\"d128b3fa-6aa2-4ac3-87ec-54c4c1766f80\",\"textAlign\":\"inherit\",\"indent\":0,\"level\":2,\"isHoverDragHandle\":false},\"content\":[{\"type\":\"text\",\"marks\":[{\"type\":\"tex
- 人工智能 . 科技周边 275 2025-11-26 16:28:22
-
- 构建AI智能体:RAG超越语义搜索:如何用Rerank模型实现检索精度的大幅提升
- 一、发轫之始在工作和生活中,我们可能经常会遇到一些场景,我们在搜索引擎中输入问题寻求解决方案,返回的却是大量重复的、基础性的、甚至是商业推广的内容。无奈的反复修正我们的检索内容,就是找不到答案,这确实是一大困扰,由于算法的局限性和商业干扰,导致搜索引擎算法倾向于流行度而非质量,商业利益常常凌驾于信息价值之上。我们得到的往往是最多人点击的,而不是最正确的。如今随着AI的大爆发,我们也在设计AI产品,我们如何突破这种信息茧房,让我们设计的系统反馈的答案更加的精准化,首先我们已
- 人工智能 . 科技周边 227 2025-11-26 16:20:15
-
- 小米进入全球汽车制造商市值前三!特斯拉孤独求败
- 近日,一份聚焦全球头部汽车制造商的市值排名出炉(注:仅包含已在证券交易所上市、从事汽车设计、开发、制造、营销和销售的公司)。数据显示,特斯拉以148.1百亿美元的市值断层第一,远超其他厂商;丰田(26.6百亿美元)、小米(14.2百亿美元)、比亚迪(12.3百亿美元)分列第二至第四名;法拉利(7.3百亿美元)、通用(6.6百亿美元)、奔驰(6.5百亿美元)、宝马(5.9百亿美元)等依次进入前十。特斯拉汽车此次排名中,中国汽车制造商共有8家上榜(占24家企业的33%),且分布于从头部到中尾部的多个
- 人工智能 . 科技周边 139 2025-11-26 16:19:46
-
- 写给开发者的数据库设计规范指南(团队实战版基础篇)
- 数据库设计是软件系统的核心基础,其规范性直接影响系统的性能、稳定性与可维护性。为保障各类产品在数据结构和系统架构上的一致性,我们团队根据多年项目经验制定了本《数据库设计规范》。该规范已在多个产品中落地实践,包括**qKnow知识平台、qData数据中台、qModel模型管理平台**等,成为统一的数据库设计标准。通过严格的规范化设计,团队在多项目并行开发中能够保持清晰一致的结构,显著提升系统质量与可扩展性。---##一、模块设计###1.模块划分规范模块划分是数据库设计的基础环节,应以**业
- 人工智能 . 科技周边 566 2025-11-26 16:17:25
-
- 东风奕派双车斩获“世界十佳” 智能科技获权威机构认可
- 在汽车评价研究院最新举办的第七届世界十佳智能汽车评选中,东风奕派旗下两款车型凭借卓越的智能化表现双双斩获殊荣:智美超能轿跑东风奕派eπ007+成功摘得“第七届世界十佳智能汽车”称号,而国民智趣纯电SUV东风奕派纳米06则荣获首届“世界十佳汽车智能座舱”奖项。东风奕派eπ007+以全域智能体验为核心优势。该车搭载基于高通骁龙8295P芯片打造的天元智舱2.0系统,算力强劲,带来毫秒级响应与丝滑流畅的人机交互。车内配备双AI大模型语音助手,支持全时免唤醒、多音区独立识别以及跨音区对话延续功能,并融合
- 人工智能 . 科技周边 916 2025-11-26 16:13:11
-
- 深入理解 Nginx 限流:背景、原理、能力边界与实战示例
- 在现代互联网系统中,“限流”已经是一个绕不开的话题。随着用户规模增长、业务场景复杂化、恶意流量与突发流量不断出现,限流成为保障系统稳定性的关键手段。而作为最广泛使用的Web服务器和反向代理组件,Nginx在限流方面能力强、性能高、部署简单,是大多数系统流量治理的第一道防线。本文将从限流背景、Nginx限流原理、能够做到的能力边界、典型应用场景,并配合多个完整配置示例进行深入讲解。1、为什么需要限流?(背景与动机)限流的核心目标是:防止突发或恶意流量把系统压垮,保持服务稳定可用。在实际业务中,限流
- 人工智能 . 科技周边 832 2025-11-26 16:00:09
-
- MySQL索引实战:一文看懂单字段索引与组合索引如何选择?
- 在MySQL数据库中,索引是提升查询效率的核心手段。科学地设计索引可以大幅缩短响应时间,而盲目添加则可能造成资源浪费并拖慢写入性能。根据实际业务需求合理选用单字段索引或组合索引至关重要。本文将深入探讨两者的适用场景,帮助开发者做出更优的索引决策。一、什么是索引?为什么需要它?形象类比:假设你手头有一本没有目录的词典,查找某个词汇只能逐页翻阅(即全表扫描)。如果加上拼音索引(单字段索引),查找速度会显著提升;若再按拼音+字母顺序建立联合索引(组合索引),检索效率更高。技术解释:索引是一种用于加快数
- 人工智能 . 科技周边 574 2025-11-26 15:57:06
-
- iOS 26.2为CarPlay带来两项实用更新:消息置顶可关闭
- 据外媒消息,随着iOS26.2测试版的陆续推送,苹果为CarPlay车载系统带来了两项值得关注的优化,进一步提升用户在车内的交互体验。首先,CarPlay的小组件功能迎来扩展。自iOS26首次引入小组件以来,用户可在车载屏幕上快速查看天气、日程、音乐等信息。而在iOS26.2中,部分车型的屏幕现在最多可同时显示三个小组件堆栈,相较此前iOS26.1仅支持两个有所提升。不过,并非所有车辆都能获得此项升级,苹果尚未公开具体支持条件,可能与车机屏幕尺寸或分辨率相关。若该功能广泛落地,将显著增强CarP
- 人工智能 . 科技周边 283 2025-11-26 15:55:00
-
- 【玩转Lighthouse】手把手教你轻量服务器Windows系统IIS下自动申请、续签SSL证书
- {\"type\":\"doc\",\"content\":[{\"type\":\"heading\",\"attrs\":{\"id\":\"af648994-0882-45f4-b408-f60ba71d649b\",\"textAlign\":\"inherit\",\"indent\":0,\"level\":1,\"isHoverDragHandle\":false},\"content\":[{\"type\":\"text\",\"text\":\"前言:\"}]},{\"typ
- 人工智能 . 科技周边 223 2025-11-26 15:52:03
PHP讨论组
组员:3305人话题:1500
PHP一种被广泛应用的开放源代码的多用途脚本语言,和其他技术相比,php本身开源免费; 可以将程序嵌入于HTML中去执行, 执行效率比完全生成htmL标记的CGI要高许多,它运行在服务器端,消耗的系统资源相当少,具有跨平台强、效率高的特性,而且php支持几乎所有流行的数据库以及操作系统,最重要的是

