PAIRDISTILL: 用于密集检索的成对相关性蒸馏方法

news/2025/5/16 3:02:02/文章来源:https://www.cnblogs.com/deephub/p/18448385

在当今海量数据时代,有效的信息检索(IR)技术对于从庞大数据集中提取相关信息至关重要。近年来,密集检索技术展现出了相比传统稀疏检索方法更加显著的效果。

现有的方法主要从点式重排序器中蒸馏知识,这些重排序器为文档分配绝对相关性分数,因此在进行比较时面临不一致性的挑战。为解决这一问题,来自国立台湾大学的研究者Chao-Wei Huang和Yun-Nung Chen提出了一种新颖的方法——成对相关性蒸馏(Pairwise Relevance Distillation, PAIRDISTILL)。

PAIRDISTILL的主要研究目的是:

  1. 利用成对重排序的优势,为密集检索模型的训练提供更细粒度的区分。
  2. 提高密集检索模型在各种基准测试中的性能,包括领域内和领域外的评估。
  3. 探索一种可以跨不同架构和领域进行一致性改进的方法。

方法改进详细描述

PAIRDISTILL方法的核心思想是利用成对重排序器提供的细粒度训练信号来增强密集检索模型的训练。该方法的主要组成部分包括:

成对重排序:与传统的点式重排序不同,成对重排序同时比较两个文档,估计一个文档相对于另一个文档与查询的相关性。形式上,给定查询q和两个文档di和dj,成对重排序器估计的概率为:

这种方法通过仅建模di和dj的相对相关性来缓解校准问题。

成对相关性蒸馏:PAIRDISTILL的目标是让密集检索器模仿成对重排序器的输出分布。密集检索器预测的成对相关性分布定义为:

训练目标是最小化密集检索器和成对重排序器的成对相关性分布之间的KL散度:

 

https://avoid.overfit.cn/post/4e825b6cc5b44ce7962f59c873afb7e4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/808678.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

复利的魔力

你是否曾经听说过"复利是世界第八大奇迹"这句话?这句被广泛归因于爱因斯坦的名言,虽然可能并非他本人所说,但却道出了复利的惊人力量。今天,让我们一起深入了解复利的魔力,看看它如何能够改变我们的财务生活!🚀 什么是复利?🤔 复利,简单来说,就是"…

School New Competition WP

试验一下博客园的基础功能,顺便把学校战队招新赛的Wp传一下, alpaca_search: 直接burp爆破把密码搞出来,在burp多抓几次包会在正确的包里发现一个新的cookie名count,count记录了正确的值 ,然后把它改成999再多发几次包,发到正确的那一个后就拿到了flag RCE_ME!!! 题目直…

Python 高级技巧:深入解析读取 Excel 文件的多种方法

一、引言在数据分析和处理中,经常需要从 Excel 文件中读取数据。Python 提供了多种库来实现这个功能,本文将深入探讨使用 ​​pandas​​、​​openpyxl​​ 和 ​​xlrd​​ 库读取 Excel 文件的高级技巧和代码实现。二、使用 pandas 库读取 Excel 文件​​pandas​​ 是 Py…

pytorch环境安装

pytorch环境安装 1.基础安装 首先安装anaconda打开,进入base,输入命令,这里-n后跟的是环境名字,再往后是python版本,不要太高 conda create -n pytorch python=3.8安装的时候有按y的就按y 创建成功后使用下面命令进入创建的环境 conda activate pytorch2.安装需要的库 pip…

FFT(2)

重新研究一遍 FFT之前写过 FFT,但是写的有点太垃圾了。令 \(*\) 指代二元运算,一般来说满足交换律和结合律。 FFT 就是当 \(*\) 为加法运算时求其卷积。先来探讨一般情况下 \(*\) 运算卷积的求法。 实际上,\(*\) 卷积就是 \(C_k=\sum\limits_{i*j=k}a_ib_j\),直接思考无法得…

blog content

米尔科非常关注生态保护,所以他不会砍掉过多的木材。学习笔记(可持久化)权值线段树 点分治 计算几何学习笔记以下在洛谷 blog简单分块与莫队 字符串 容斥原理与欧拉函数,莫比乌斯函数-学习笔记 逆元 容斥原理与概率期望-学习笔记 DP-学习笔记(基础篇) 二分刷题 板刷【高频更…

从前的日色变得慢 车,马,邮件都慢 一生只够爱一个人 现在的测评变得更慢 LG,CF,vjudge都慢 一下午只够交完一道题

[Trick] 格路记数 - 反射容斥

Perface 模拟赛不会被冲烂了。 Problem I 从 \((0,0)\) 到 \((n,m)\) 方案数。 解法: \(C(n+m,m)\)。 Problem II 从 \((0,0)\) 到 \((n,m)\) 方案,但是不能经过 \(y=x+b\) 的直线。 解法: 考虑映射法。 以一条路径第一次碰到直线的位置为起点,之后所有的路线和 \(y=x+b\) …