论文能不可中?不错用 AI 提前估量~探花 巨乳
港大黄超评释团队提议多智能体自动化框架GraphAgent,能自动构建息争析常识图谱中的复杂语义收集,轻佻各种估量和生成任务。
GraphAgent 通过图生成、任务运筹帷幄和任务扩充三大中枢智能体的协同运作,交融大道话模子与图道话模子的上风,奏效联结了结构化图数据与非结构化文本数据,在文本回归与关系建模方面杀青了彰着提高。
实验中,在估量性任务(如节点分类)和生成性任务(如文本生成)上,GraphAgent 均获取杰出恶果,仅以 8B 参数限制便达到了与 GPT-4、Gemini 等大限制闭塞源模子异常的性能水平。
尽头在零样本学习和跨域泛化等场景中,GraphAgent 展现出权臣上风。
有预想的是,团队将 GraphAgent 应用到了学术论文评审场景。
在实质投稿历程中,作家频频需要左证评审意见准备 Rebuttal 复兴,而 GraphAgent 仅基于论文评审意见(Reviews)就能匡助作家更好地评估论文的登第可能。
GraphAgent 长啥样?
履行寰球的数据呈现双重秉性:一方面是结构化的图联结数据,另一方面是曲结构化的文本与视觉信息。
这些数据中蕴含的关系收集也分为两类:显式的联结关系(如酬酢收集互动),以及隐式的语义依赖(常见于常识图谱)。
这种复杂性带来了三大中枢挑战:
异构数据交融:系统需要整合多种体式的信息。以学术收集为例,论文间的援用组成了图结构关系,而标题、摘抄等文本则承载着丰富的语义信息。灵验整合这些异构信息可援助常识回归、科学问答等应用。
多档次关捆绑识:实质场景中频频存在多维度的关联。举例电商平台中,用户 - 商品交互组成行径图谱,家具批驳则形谚语义收集。深入结识这些多层关系有助于提高用户 - 商品交互估量的准确性。
好看的日本av任务多元化:应用场景条件系统具备日常的处贤达力。估量类任务包括节点分类、衔接揣摸等图分析;生成类任务触及图增强文本生成、常识图谱问答等。这需要系统大略生动允洽不同任务秉性,并充分利用数据中的结构化与语义信息。
为轻佻上述挑战,酌量团队提议多智能体自动化框架 GraphAgent。
该框架通过三大中枢智能体的协同团结,杀青了图结构与语义信息的深度交融,可同期援助估量型(图分析、节点分类)和生成型(文本创作)等种种化任务。
其中枢架构包括:
图生成智能体(Graph Generator Agent)
任务运筹帷幄智能体(Task Planning Agent)
任务扩充智能体(Task Execution Agent)
三大智能体通过协同机制紧密团结,交融大道话模子与图道话模子的上风,灵验挖掘数据中的关系收集与语义依赖。
底下详尽先容各个智能体的中枢功能:
图生成智能体
图生成智能体追究构建语义常识图谱(Semantic Knowledge Graph, SKG),通过立异的双阶段迭代机制杀青深层语义信息的索求与整合。
该智能体的责任历程分为两个中枢阶段:
1)常识节点索求阶段
该阶段遴选自允洽的分层政策,从非结构化文本中识别多维度的常识实体:
通过定制化的系统请示,调用大道话模子(LLM)处理输入文本
应用迭代式识别本事,同期拿获宏不雅边界见解(如" Machine Learning ")和微不雅本事细节(如" Self-Supervised Learning ")
基于多轮迭代构建档次化常识结构,确保常识体系的完竣性与连贯性
2)常识形色增强阶段
这一阶段戒备提高常识暗示的丰富度与准确性:
为每个识别的节点生成详确的语义形色
整合干系高下文信息,构建完竣的常识考虑
遴选动态迭代更新机制:i ) 将每轮形色行为下轮优化的基础;ii ) 不息深化和拓展常识内容;iii ) 通过多轮迭代交融,最终形谚语义完备的常识图谱
任务运筹帷幄智能体
任务运筹帷幄智能体行为框架的决策中枢,通过精密的三阶段处理机制完成复杂任务的运筹帷幄与认识。
其责任历程包括:
1)意图识别与任务制定
该阶段专注于准确结识用户需求并笃定处理政策:
深度贯通用户查询,索求核情意图
将任务分类为三大类型:预界说图估量(Predictive_predefined),处理已知结构的图分析;洞开图估量(Predictive_wild),轻佻未知结构的图推理;目田生成任务(Open_generation),扩充生动的创作需求。
2)图结构设施化处理
此阶段杀青不同类型图数据的并吞抒发:
应用专科图构建器用(GBW_Tool)进行结构颐养
同步处理显式关系图(G_exp)与语义常识图(G_skg)
开荒设施化的异构图暗示体系,确保处理一致性
3)图文特征交融
这一阶段戒备杀青信息的深度整合:
结合预考试文本编码器与图神经收集,构建双层编码体系
生成文本语义与图结构的荟萃暗示
为卑鄙任务提供丰富的特征援助,奠定扩充基础
图动作智能体
图动作智能体是框架的中枢扩充单位,通过立异的三维处理架构,杀青了任务的精确扩充与性能优化。
其责任机制包括:
1)智能化任务处理机制
针对不同类型任务遴选各异化处理政策:
估量类任务:瞎想专属系统请示,辅导模子进行精确估量
生成类任务:交融语义常识图谱,提高文本生成的质地与干系性
自允洽优化:左证任务秉性动态调理处理历程,确保扩充服从
2)深度图指示对皆本事
立异性地杀青了多档次的模态对皆:
同类型图结构对皆:增强模子对特定图模式的结识智力
跨类型常识交融:提高处理异构图关系的准确性
双向增强机制:权臣提高模子在种种化场景下的泛化进展
3)渐进式学习政策
遴选先进的课程学习方法:
基于难度梯度的任务编排:从基础到进阶的平滑过渡
致密化的考试序列瞎想:确保常识聚积的连气儿性
全地点性能调优:在各种任务中保持康健的高水平进展
实验数据集建立
实验评估遴选了六个各具特色的基准数据集,涵盖了不同场景和任务类型。
如 Table 1 所示,这些全心接管的数据集在限制、结构和应用边界等方面展现出权臣各异,为全面考证框架性能提供了瞎想的测试基础。
为全面评估 GraphAgent 的通用性能,本酌量精选了六个具有代表性的基准数据集开展系统实验。这些数据集按照任务特征可永诀为三大类:
结构化图数据集 : 遴选了两个经典的节点分类数据集 IMDB 和 ACM。其中 IMDB 数据集包含 11,616 个节点,ACM 数据集涵盖 10,942 个节点,这两个数据集都具有昭彰的图结构特征,为评估模子在结构化数据处理方面的智力提供了可靠基准。
文本处理数据集 : 接管了 Arxiv-Papers 和 ICLR-Peer Reviews 两个具有代表性的数据集。Arxiv-Papers 构建了包含 153,555 个 SKG 节点的语义常识图,用于评估文档分类性能;ICLR-Peer Reviews 则包含 161,592 个 SKG 节点,专诚用于论文委用估量任务,这些数据集体现了模子处理复短文本及语义关系的智力。
智能生成数据集 : 引入了 Related Work Generation 和 GovReport 回归两个具有挑战性的数据集。Related Work Generation 基于多篇论文构建,包含 875,921 个 SKG 节点,用于考证模子的干系责任生成智力;GovReport 包含 15,621 个 SKG 节点,针对长文档摘抄生成任务,这两个数据集都对模子的生成智力提议了较高条件。
实验效果分析
结构化数据估量性能分析
为深入评估 GraphAgent 在结构化图任务中的零样本学习智力,酌量团队瞎想了一组的对比实验。
实验遴选 IMDB 数据集进行模子考试,分别在 1-shot 和 40-shot 两种低资源场景下考证模子性能,并在 ACM 数据集的 1,000 个未见节点上开展移动测试,以评估模子的泛化智力。
实验死心标明:GraphAgent 在所关联键缱绻上都权臣优于刻下起原进的图道话模子 HiGPT,平均性能提高跨越 28%。模子在 40-shot 建立下获取了权臣性能提高:Micro-F1 和 Macro-F1 均达 74.98%(提高 48.5%/63.5%),AUC 达 80.90%(提高 27.2%)。
GraphAgent 的超卓性能主要源于三项中枢本事立异:
起始,智能图生成机制通过自动构建语义常识图谱(SKG)为模子注入丰富的补充信息,权臣增强了复杂语义关系的结识智力;
其次,精确的任务运筹帷幄机制使模子大略准确结识和认识用户意图,并为不同应用场景制定最优扩充政策;
终末,立异性的双重优化政策结合了图文对皆和任务微调机制,不仅提高了模子的基础性能,还增强了移动学习智力,使模子即使在 1-shot 等低资源场景下仍能保持康健的高性能进展。
语义结识智力分析
为深入评估 GraphAgent 在复杂语义关系处理方面的性能,酌量团队基于两个典型数据集开展了系统实验:利用 Arxiv-Papers 数据集进行论文分类考证,并通过 ICLR-Peer Reviews 数据集测试论文委用估量智力。
通过严格的实验评估,GraphAgent 在处理隐式语义依赖关系时展现出如下杰出上风:
实验死心突显了 GraphAgent 的三大中枢上风:
在参数限制优化方面,仅有 8B 参数的 GraphAgent 凭借其私有的语义常识图谱架构,奏效杀青了对复杂语义依赖关系的精确把捏,通过多档次语义信息的局部与全局整合,在各项评估缱绻上权臣卓越了 Llama3-70b 和 Qwen2-72b 等大限制模子,平均性能提高达 31.9%。
在泛化智力进展上,GraphAgent 展现出超卓的跨任务学习后劲。其多任务版块 GraphAgent-General 在 Arxiv-Papers 数据集的进展致使优于专诚优化的单任务版块。
尽头值得安靖的是,8B 限制的 GraphAgent 在零样本场景下也能达到 Deepseek-Chat-V2 等大型闭源模子的性能水平。
在架构服从方面,GraphAgent 通过立异性地整合语义常识图谱和结构化常识暗示,比较传统的监督微调方法和 GraphRAG 系统,不仅权臣提高了模子性能,还灵验裁汰了输入支拨,同期奏效缓解了大道话模子常见的幻觉问题。
文本生成任务
GraphAgent 在图增强文本生成任务中展现出超卓进展,通过性能评估、模子对比和架构分析三个维度的系统实验,充分考证了其杰出上风。
基于 Llama3-70b 和 Qwen2-72b 的双重对比考证标明,GraphAgent 在困惑度(PPL)等中枢缱绻上权臣优于基线模子。不同于传统的监督微调(SFT)和 GraphRAG 方法,GraphAgent 通过智能构建语义常识图谱,从根底上提高了模子的推理结识智力,灵验措置了成例微调和常识注入方法在处理复杂推理模式时的固有局限。
在架构立异和性能对标方面,GraphAgent 展现出杰出上风。
以 GPT-4 为评判基准的实验自大,GraphAgent 比较 Llama3-8b 和 Llama3-70b 分别杀青了 114% 和 45% 的性能提高,在 67% 的测试案例中起始同等限制模子,58% 的情况下卓越主流开源决策。
尤为权臣的是,GraphAgent 仅以 8B 的参数限制和极低的狡计支拨便达成这些超卓恶果,充分考证了基于语义常识图谱的架构瞎想在增强文本生成智力方面的权臣效果。
消融实验
通过系统化的消融实验(Ablation Study),酌量团队深入评估了 GraphAgent 架构中三个中枢组件的性能孝顺,酌量死心揭示了以下要道发现:
语义常识图谱(SKG)的基础援助作用:移除 SKG 组件导致模子性能权臣裁汰 15.2%,充分确认了自动构建的语义常识图谱在提供要道补充信息方面的不可替代性。这一发现强调了结构化常识暗示对模子合座性能的决定性影响。
图文对皆机制的垂死性:实验标明,缺失图文对皆机制变成了最权臣的性能亏损,困惑度(PPL)增多达 11.282。这杰出标明深档次的图文结识智力关于需要复杂推理的生成任务至关垂死,是保险模子高质地输出的要道设施。
课程学习政策的优化效果:固然相较其他组件影响相对较小(估量任务裁汰 4.0%,生成任务 PPL 增多 0.503),但课程学习政策的缺失仍对双任务性能产生彰着负面影响。这考证了渐进式学习旅途在优化模子考试效果方面的积极作用。
终末酌量团队潜入了他们的翌日酌量方针,包括:
多模态智力拓展:缱绻将刻下框架的处贤达力膨胀至视觉信息边界,开荒援助关系型数据、文本内容和视觉元素的详尽处理机制。这一拓展不仅包括多模态信息的结识与交融,还将重心开荒跨模态常识暗示和生成智力,从而杀青更丰富的智能交互场景。尽头温雅视觉 - 文本 - 关系的协同建模,为多模态智能系统开辟新的酌量方针。
模子性能优化:尽力于于提高模子在复杂履行场景中的泛化进展,重心酌量如安在保持或提高性能的同期杀青模子压缩。这触及立异的模子架构瞎想、高效的参数分享机制以及先进的常识蒸馏本事。同期,将探索狡计资源优化政策,提高模子在实质部署环境中的服从,为大限制应用奠定基础。
应用场景膨胀:积极探索框架在多个实质边界的落地应用,重心温雅科学酌量辅助和生意智能分析等高价值场景。在科研边界,将开荒专诚的文件分析和常识发现器用;在生意边界,戒备构建面向决策援助的智能分析系统。同期,密切温雅新兴本事趋势,探索在医疗健康、金融科技等边界的应用场景。
名目地址:https://github.com/HKUDS/GraphAgent
论文衔接:https://arxiv.org/abs/2412.17029
实验室主页 : https://sites.google.com/view/chaoh
— 完 —
投稿请发邮件到:
ai@qbitai.com
标题注明【投稿】,告诉咱们:
你是谁,从哪来,投稿内容
附上论文 / 名目主页衔接,以及考虑格局哦
咱们会(尽量)实时回复你
点这里� � 温雅我,谨记标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日再见 ~