解决三大问题,实现GTE-QWEN的Rust推理

使用Rust语言实现通义千问的文本嵌入式特征模型。了解特征提取模型与因果语言模型在推理时的差异,以及输入数据的预处理技巧。

在上一篇文章“通用文本语义特征提取模型GTE-QWEN”中,我们通过分析官方提供的Python实现了解了如何将用于输出下一个Token的大语言模型改造为输出固定长度嵌入式特征的模型。遗憾的是,当时Candle尚未支持GTE-QWEN。不过不要紧,自力更生根植于我们的基因当中。这篇文章记录了我是如何成功实现Rust语言环境下的GTE-QWEN推演。

本文涉及环境信息

  • Rust:rustc 1.76.0 (07dca489a 2024-02-04)
  • Candle:主分支,commit ID bdaa3421