Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, 2008 (Cambridge University Press) - 这本教材提供了向量空间模型、相似度度量以及信息检索和语义搜索原理的基础知识,解释了文本如何被表示为向量以及如何衡量相似度。
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks, Nils Reimers and Iryna Gurevych, 2019Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP) (Association for Computational Linguistics)DOI: 10.18653/v1/D19-1410 - 本文介绍了Sentence-BERT,一种生成高质量句子嵌入的模型,可直接应用于现代大型语言模型(LLM)应用程序中的语义相似度任务,并解释了如何推导上下文嵌入。