作者: abanana

10 篇文章

thumbnail
AdaptThink: 让模型决定是否思考
AdaptThink: Reasoning Models Can Learn When to Think 摘要 最近,大型推理模型通过采用类似人类的深度思考,在各种任务上取得了令人印象深刻的表现。然而,冗长的思考过程显著增加了推理开销,使得效率成为关键瓶颈。在这项工作中,我们首先证明了对于相对简单的任务,NoThinking(即提示推理模型跳过思考…
thumbnail
AdaCoT:通过强化学习实现的帕累托最优自适应链式思维触发器
摘要 LRM在需要复杂推理的任务上常常面临挑战。尽管CoT显著提升了推理能力,但它会不分情况地为所有查询生成冗长的推理步骤,这导致了巨大的计算成本和低效,尤其是对于简单输入时更是如此。为了解决这一关键问题,我们提出了AdaCoT,使LLMs能够自适应地决定何时调用CoT。AdaCoT将自适应推理建模为一个Pareto Improvement问题,旨…
thumbnail
Hmm等Token影响模型推理能力
Demystifying Reasoning Dynamics with Mutual Information: Thinking Tokens are Information Peaks in LLM Reasoning 感觉Motivation阐述的不是很明确,但是想法的不错但是工程方面似乎有些问题,详情请看下面的高亮块 摘要 大规模推理模型(…
thumbnail
SEAL:大语言模型的可操控推理 Traning Free
SEAL: Steerable Reasoning Calibration of Large Language Models for Free 摘要 大语言模型(Large Language Models,LLMs),例如 OpenAI 的 o1 系列,已展现出通过扩展的思维链(chain-of-thought,CoT)推理机制处理复杂推理任务的出…
thumbnail
算法笔记——Transformer
Transformer大致结构如下: 左侧灰框代表Encoder中的一层,右侧灰框是Decoder中的一层 灰框旁边的$N\times$代表多层组成一个完整的Encoder或Decoder Add & Norm代表残差连接和归一化 Transformer的每个模块 位置编码 下面的公式中,2i和2i+1代表位置编码中对应的维度,d代表位置编…
thumbnail
运维文档1——服务器
服务器是什么? 服务器就是一台电脑,本节完。 服务器就是一台提供服务的电脑,大多数服务器24小时开机,拥有公网IP。但是部分服务器由于安全问题是没有公网IP的,不过我们可以在一定程度上认为它是有公网IP的,至少通过某种方式将自己的某些端口暴露了出来。 为什么需要服务器? 为什么需要服务器?我自己电脑不可以吗? 我们来看看服务器和自己的电脑的区别,上…
thumbnail
Nginx调优——配置Brotli和Gzip共存
什么是Brotli 项目地址: https://github.com/google/ngx_brotli Brotli最初发布于2015年,用于网络字体的离线压缩。Google软件工程师在2015年9月发布了包含通用无损数据压缩的Brotli增强版本,特别侧重于HTTP压缩。其中的编码器被部分改写以提高压缩比,编码器和解码器都提高了速度,流式API…
如何部署Flask程序
要将Flask部署到公网,我们可以采用一下的形式 Nginx --> uWSGI --> Flask 其中uWSGI用于执行Flask代码,这一套是一套比较经典的Flask配置,也是官方推荐的配置之一。 安装配置uWSGI 我们先来看看如何安装uWSGI,同样还是以Debian为例 如何安装uWSGI 安装依赖包 sudo apt up…
thumbnail
如何搭建面向公网的Nginx服务
由于主流Web服务器Apache、Nginx和Caddy中,本人对于Nginx比较擅长,因此本人将主要基于Nginx进行介绍。同时Linux各种发行版中,本人对于ArchLinux和Debian比较擅长且Debian在服务器领域市占率明显高于ArchLinux,服务器将基于Debian进行介绍。 公网服务器 首先我们需要一台公网服务器,什么是公网服…
如何让Nginx禁止搜索引擎索引
为什么要禁止搜索引擎收录呢? 真的有人会这样吗? 其实还是有的,比如一个人搭建了镜像,但是不想被其他人发现,那他就需要这样配置。 怎么配置呢? 我采用的方式是让给让Nginx根据搜索引擎爬虫的UA来阻断连接,将以下代码放入Nginx的server块中即可 if ($http_user_agent ~* "qihoobot|Baiduspider|G…