RAG的最新方案——HyKGE
HyKGE框架简介 本文基于由北京大学计算机学院Xinke Jiang、Ruizhe Zhang、Yongxin Xu、Rihong Qiu等作者共同撰写的论文《HyKGE: A Hypothesis Knowledge Graph Enhanced Framework for Accurate and Reliable Medical LLMs Responses》。 HyKGE代表了知识图谱(KGs)与检索增强生成(RAG)技术结合的最新进展。通过利用大型语言模型(LLM)的深度语义理解与知识生成能力,结合知识图谱丰富的结构化信息,HyKGE能够显著提高医学信息检索的效率,并确保回答的精确度。这一突破性成果为医学LLMs的发展开辟了新的视野,同时也为未来在更广泛的应用场景中利用大型语言模型和知识图谱提供了宝贵的经验和启示。 RAG面临的技术挑战与解决方案 在传统的检索增强生成(RAG)方法中,主要有如下不足: 检索粒度单一 文档检索通常基于整个文档或段落,检索粒度较粗; 全局语义理解能力有限 基于关键词的文档匹配忽略了文档间的深层语义关系; 缺乏推理能 ...
圆周率一定是3.14...吗?
作者:ΔδDelta\Delta\delta DeltaΔδDelta 审核:白烟 曾有一篇名为《勾股:2.013》的科幻小说在多年前的网络上风靡,甚至直至今日也会有人想起这篇文章。作品末尾有一段话引人遐想: “不要从我们的角度去评价他们的智慧,也许我们的文明,也在某个更大的扭曲时空之中呢——你难道不觉得,圆周率 3.1416 ,也是个非常古怪的数吗?” 事实上,这篇小说存在的漏洞颇多,但其文学价值不应被否定,它也确实激发了不少人学习科学以及数学的兴趣。直至今日,我们仍能借此为引,来简单科普一下关于圆周率值的问题。 回首这句令人浮想联翩的话语,圆周率 π=3.1415926…\pi = 3.1415926 \dotsπ=3.1415926… 真的十分古怪吗?这个数字真的是因为扭曲时空才导致的吗? 两个问题都是 否定 的。实际上,无理数并不应因其没有规律可循就在美学上被人诟病——这也太不公平了。难道有人能给任何艺术总结出来一个规律吗?(场外音:AI绘画!!!这不就是找到了艺术的“规律”才能用机器画出来的吗?) 但定义这些AI的参数也是没有规律的呀?3202年了,神 ...
如何将飞船送往其他行星?简谈航天器的运动和轨道问题
作者:丛雨 审核:时光 要把探测器送往火星,总共需几步?一般来讲,从地球发向其他行星的探测器的飞行过程大致分为三个阶段:火箭发射升空并绕地球运行、变轨加速以脱离地球引力前往目标行星、抵达后在目标行星上环绕或着陆。其中一三阶段时间短但步骤和细节繁杂,而二阶段将占据飞行器旅程的大部分时间。本文将从航天器的运动和轨道问题出发,介绍天体运动和变轨问题的一些简单知识。 三种宇宙速度 我们将首先从航天器的速度问题开始。 众所周知,水平方向抛出的物体,初速度越快,落点越远,当它的速度达到7.9 km/s时,便再也无法落回地面,将仅在地球引力的影响下环绕地球做匀速圆周运动。这便是地球的第一宇宙速度,是发射人造卫星的最小初速度,也是以圆轨道绕地球运动的最大线速度。 如果发射时初速度达到约11.2 km/s,即地球的第二宇宙速度时,飞行器就能恰好完全摆脱地球的引力,且之后无需加速。天体的第二宇宙速度又称逃逸速度,以逃逸速度从天体表面沿任何方向发射的无动力物体,在引力作用下速度会慢慢减小,当飞行至无穷远时速度恰好为 000 。逃逸速度是第一宇宙速度的 2\sqrt{2}2 倍,可用动能和引力势能(E ...
计算机小白如何0代码搭建个人博客/简历网站?
作者:Thinker 审核:I 你希不希望拥有一个属于自己的博客/简历网站呢?在独属于我们的小空间里,我们可以自由地发挥想象力,打造出一片独一无二的世界。接下来,笔者将向各位读者介绍如何超快速、超简单地搭建个人博客/简历网站。 注册Github 什么是Github?Github是一个开源代码托管平台,用户可以在上面分享和管理项目。如果你还没有Github账号,那么在本节中笔者将会指导你如何注册一个新的Github账号。如果你已经有一个Github账号了,请直接跳过本节。 如何注册Github? 打开Github网站 首先,打开你的浏览器,进入Github官网,网址是 https://github.com/。 填写注册表格 在Github网站首页,点击右上角的“Sign up”按钮,进入注册页面。在注册页面上,你需要填写以下信息:用户名、电子邮件地址和密码。请确保你使用的电子邮件地址是有效的,因为你需要通过电子邮件验证你的账号。填写完毕后,点击“Create an account”按钮。 验证你的邮箱地址 第二步完成之后,Github将会向你提供的电子邮件地址发送一封验证邮件。 ...
什么是星际介质?
星际介质 作者:栗小白 审核:水果干 引言 我们的宇宙中不仅仅有众多恒星与行星,在星际空间中还弥漫着密度极低的物质(远比地球上能制造的最好的真空环境还要稀薄的多),这些被称为星际介质的物质占据了行星之间的广阔空间。 星际介质 星际介质主要由气体和尘埃两部分组成。多数情况下,星际气体的元素丰度和其他天体非常类似,大部分气体(大约90%以上)都是氢原子或氢分子,还有大约9%为氦,剩下为重元素。我们对于星际尘埃并不是很了解,一些红外波段观测的证据显示,星际尘埃中包括硅酸盐,石墨和铁以及“脏冰”(由水、冰和氨、甲烷以及其他化合物组成的混合物)。 星际介质有两个重要的性质:消光和红化。接下来,我将为大家阐述这两个性质的成因。 消光 尘埃颗粒可以且只会吸收波长小于或约等于其半径的光。因此波长越短,收到尘埃阻挡的总量就会越多 。星际尘埃的直径大约为10^-7m,与可见光波长相当,因此星际尘埃对星光具有消弱作用。 红化 由于星际介质对于短波的阻挡能力强于长波辐射,因此在遥远的恒星光线中,频率更高的光子恒容易被星际介质“劫持”,使得恒星看起来比实际更红,这就是红化。原理如下图所示: ...
注水定理的证明
作者:phy-东西 审核:水缸 问题描述 “注水定理”解决的是信息论中的一个基本问题:以总容量最大化为目标的AWGN信道功率分配方案优化。该问题描述如下:有 KKK 个并联 AWGN 信道且噪相互声独立,噪声功率依次为 σ12,σ22,⋅⋅⋅,σK2σ^2_1,σ^2_2,··· ,σ^2_Kσ12,σ22,⋅⋅⋅,σK2。总功率受限于 PPP,求出使 KKK 个并联信道功率最大化的功率分配方案。 写做优化问题格式为: maxp1,…,pK∑k=1Klog2(1+pkσk2)s.t.∑k=1Kpk≤Ppk≥0, k=1,2,…,K(1.1)\begin{aligned} &\max_{p_1, \dots , p_K}\sum^{K}_{k=1} \log_2 \left(1 + \frac{p_k}{\sigma ^2_k}\right)\\ \mathrm{s.t.}&\sum^K_{k = 1}p_k \le P\\ &p_k \ge 0, \ \ \ k = 1, 2, \dots , K\end{aligned} \tag ...
边界层理论
作者:锅炉-251 审核:水管工 边界层理论的提出 “边界层理论”的概念最早可以追溯到十九世纪时的流体力学。当时的理论流体力学从无粘不可压缩的欧拉方程进行推导,由于忽视粘性影响导致理论与实验结果存在明显的矛盾,难以解释管路压将等问题。在当时其实已经提出了有摩擦的 纳维斯托克斯方程 ,但受限于数学水平无法求解方程,故理论与实际一直存在巨大误差。最后从实际出发发展出了 水力学 ,通过实验数据避开了理论分析。 在此基础上,普朗特 (Ludwig Prandtl) 提出了 边界层 的概念,在海德尔堡第三届国际数学家大会上发表了 “关于摩擦极小的流体运动” 一文。在该论文中,普朗特提出绕固体流动的流体可分为两个区域: 在物体表面很薄的一层,在其中粘性力起着重要作用 在该层外的主流区域,此处的摩擦可以忽略不记 “边界层”这一理论的提出,极大的化简了理论求解动量方程。 路德维格·普朗特 后来,在实验中科学家们发现,边界层具有以下特点: 与物体特征长度相比,边界层厚度远小于特征长度; 边界层内存在很大的速度梯度; 边界层厚度随流动方向增加; 边界层各截面压强等同于主流上的 ...
恒星综述——恒星研究基础
作者:栗小白(SDU) 审核:时光 题记 既然是“科普”,我们不写高深莫测的黑洞、量子力学、M理论(下次可就不一定不整这些了),也不整一些看不懂的数学符号或者名词唬人(这个请放心,肯定不会在鄙人的文章里出现,因为鄙人的数学也不好),甚至连公式都没有(之所以没有是因为太难print了)。这篇文章介绍了和恒星有关的最最最最最基本的概念和关于恒星的研究,还有更多方面就不赘述了。那么,正文正式开始! Part 1 光度和视亮度 顾名思义,光度和视亮度这两个物理量表示的是星星有多亮,两者既有区别又有联系。 区别 光度是恒星的固有属性,与观察者的位置速度无关。光度也被称为绝对亮度。 视亮度测量的则是从地球上观测到的来自恒星的能量通量(单位面积单位时间内接收到的能量) 联系 用脚指头想一下,视亮度肯定是和星星本身有多亮(光度)和星星与我们之间的距离有关。那么视亮度和距离有什么关系呢?这又是一个平方反比律。我们看看下图的图解就非常容易理解了这个关系了。 视亮度和距离的关系图解 综上,我们发现恒星的视亮度和恒星的光度成正比,和距离的平方成反比。 想必各位天文爱好 ...
触发器的原理和应用
触发器的原理和应用 作者:浮槎 审核:时光 要提到计算机的工作原理,就不得不提到一种电子装置:触发器。触发器主要由两个电子管组成,当电流通过触发器时会通过其中一个电子管。触发器一共有四个接触点,其中两个用来接收外部脉冲,另外两个用来输出回答脉冲。外部脉冲输入的瞬间,触发器就会“翻转”,使原本导通的电子管变成闭合状态,电流转而进入另一个电子管。当一边电子管闭合、另一边电子管导通的瞬间,触发器就会输出回答脉冲。 现在我们给触发器连续不断地输入脉冲,并根据图1中两根电子管其中的一根——右侧的电子管的状态来确定触发器的状态:当右侧电子管闭合时,设定触发器是「0 状态」;当右侧电子管导通时,设定触发器是「1 状态」。 如果触发器的初始状态为「0 状态」,即右侧电子管为闭合状态时(如图 1所示),那么输入第一个脉冲后,右侧电子管导通,触发器翻转成「1 状态」。此时,触发器不会输出回答脉冲,因为左侧电子管并未导通。接下来,当我们输入第二个脉冲时,左侧电子管导通,右侧电子管闭合,触发器翻转为「0 状态」,输出回答脉冲。 通过观察可以发现,经过两次输入脉冲之后触发器回到了原始状态。 ...
2022诺贝尔物理奖成果介绍
纠缠态——从理论到技术 Alain Aspect、John Clauser和Anton Zeilinger用纠缠量子态进行了开创性的实验。在纠缠量子态中,即使两个粒子分离,它们也表现得像一个单独的单元。他们的研究结果为基于量子信息的新技术扫清了道路。 量子力学的不可言喻的效应正在开始得到应用。现在有一个很大的研究领域,包括量子计算机、量子网络和安全的量子加密通信。 这一进展的一个关键因素是,量子力学如何允许两个或多个粒子以所谓的纠缠态存在。纠缠对中的一个粒子发生的情况决定了另一个粒子发生的情况,即使它们相距很远。 在很长一段时间里,问题在于这种相关性是否是因为纠缠对中的粒子包含隐藏变量,即告诉它们在实验中应该给出哪个结果的指令。20世纪60年代,John Stewart Bell提出了以他的名字命名的数学不等式。这表明,如果存在隐藏变量,那么大量测量结果之间的相关性将永远不会超过某个值。然而,量子力学预测,某种类型的实验将违反贝尔不等式,从而产生比其他情况下更强的相关性。 John Clauser发展了John Bell的想法,开展了一个实际的实验。当他进行测量时,它们显然违反了贝尔 ...