Introduction to Algorithms, Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, and Clifford Stein, 2022 (MIT Press) - 这本标准教材全面介绍了数据结构和算法,包括复杂度分析(O(n), O(1))、哈希表、列表和树,这些都是理解机器学习性能的必要基础。
Feature Hashing for Large-scale Multitask Learning, Kilian Weinberger, Anirban Dasgupta, John Langford, Alex Smola, Josh Attenberg, 2009Proceedings of the 26th International Conference on Machine Learning (ICML) (International Machine Learning Society (IMLS))DOI: 10.48550/arXiv.0902.2206 - 这篇论文介绍了特征哈希,一种利用哈希函数将高维数据转换为低维表示的方法,文中直接引用了该方法用于高效的特征工程。
Python for Data Analysis, Wes McKinney, 2022 (O'Reilly Media) - 本书由Pandas的创建者撰写,解释了Pandas等库如何利用高效的底层数据结构(基于NumPy数组)实现快速数据加载、准备和操作,这在文中得到了强调。