解决三大问题，实现GTE-QWEN的Rust推理

使用Rust语言实现通义千问的文本嵌入式特征模型。了解特征提取模型与因果语言模型在推理时的差异，以及输入数据的预处理技巧。

在上一篇文章“通用文本语义特征提取模型GTE-QWEN”中，我们通过分析官方提供的Python实现了解了如何将用于输出下一个Token的大语言模型改造为输出固定长度嵌入式特征的模型。遗憾的是，当时Candle尚未支持GTE-QWEN。不过不要紧，自力更生根植于我们的基因当中。这篇文章记录了我是如何成功实现Rust语言环境下的GTE-QWEN推演。

本文涉及环境信息