Stochastic Average Gradient (SAG)

Was this section helpful?

References

Optimization Methods for Large-Scale Machine Learning, Léon Bottou, Frank E. Curtis, and Jorge Nocedal, 2018 SIAM Review, Vol. 60 (Society for Industrial and Applied Mathematics) DOI: 10.1137/16M1080173 - A comprehensive survey of optimization methods, including SAG, for large-scale machine learning problems.
Accelerating Stochastic Gradient Descent using Predictive Variance Reduction, Rie Johnson, Tong Zhang, 2013 Advances in Neural Information Processing Systems 26 (NIPS 2013) (Curran Associates Inc.) DOI: 10.55989/NIPS-2013-1070 - This paper introduces Stochastic Variance Reduced Gradient (SVRG), a successor to SAG addressing its memory limitations.