Аннотация.
В статье рассматриваются различные программные реализации автоматизации процесса машинного обучения для решения задачи регрессии. Рассмотрено внутреннее устройство и возможности ряда существующих и обширно используемых инструментов автоматизированного машинного обучения таких, как LightAutoML (LAMA), TPOT, Auto-Sklearn, H2O AutoML, MLJAR. Возможности данных программных систем были исследованы для решения задачи регрессии на нескольких наборах данных. В результате исследования была выведена общая структура программного решения автоматизированного машинного обучения, которая может быть взята за основу при дальнейшем проектировании и разработке собственного программного продукта, а также проанализирована точность, с которой системы предсказывали значения целевого признака.
Ключевые слова:
автоматизированное машинное обучение, LAMA, TPOT, Auto-Sklearn, H2O AutoML, MLJAR, регрессия.
Стр. 43-54.
DOI: 10.14357/20790279230106 Литература
1. Nagarajah, T., Poravi, G. A Review on Automated Machine Learning (AutoML) Systems. In: 2019 IEEE 5th International Conference for Convergence in Technology (I2CT), pp. 1–6. Pune, India (2019). https://doi.org/10.1109/I2CT45611.2019.9033810 2. Bahri, M., Salutari, F., Putina, A. et al. AutoML: state of the art with a focus on anomaly detection, challenges, and research directions. Int J Data Sci Anal (2022). https://doi.org/10.1007/s41060-022-00309-0 3. Karmaker, S., Hassan, M.M., Smith, M.J., Xu, L., Zhai, C., Veeramachaneni, K. AutoML to Date and Beyond: Challenges and Opportunities. ACM Computing Surveys (CSUR) 54, 1–36 (2022) 4. He X., Zhao K., Chu X. AutoML: A survey of the state-of-the-art. Knowl. Based Syst., 212, 106622. https://doi.org/10.1016/j.knosys.2020.106622 5. Escalante, H.J. Automated Machine Learning – a brief review at the end of the early years. arXiv:2008.08516. https://doi.org/10.48550/ arXiv.2008.08516 6. Bahri, M., Salutari, F., Putina, A., Sozio, M. AutoML: state of the art with a focus on anomaly detection, challenges, and research directions. International Journal of Data Science and Analytics, Springer Verlag, 2022. https://doi.org/10.1007/s41060-022-00309-0 7. Koroteev, M.V. Review of some modern trends in machine learning technology. E-Management 1(1), 26–35 (2018) 8. Feurer, M., Eggensperger, K., Falkner, S., Lindauer, M.T., Hutter, F. Practical Automated Machine Learning for the AutoML Challenge 2018. In: International Workshop on Automatic Machine Learning at ICML, pp. 1189-1232 (2018) 9. Car Dekho Data, https://www.kaggle.com/datasets/shindenikhil/car-dekho-data. Last accessed 12 December 2022 10. Combined Cycle Power Plant Dataset, h t t p s : / / a r c h i v e . i c s . u c i . e d u / m l / d a t a s e t s / Combined+Cycle+Power+Plant. Last accessed 12 December 2022 11. LightAutoML – Automatic model creation framework, https://github.com/sb-ailab/LightAutoML. Last accessed 12 December 2022 12. TPOT – A Python Automated Machine Learning tool, https://github.com/EpistasisLab/tpot. Last accessed 12 December 2022 13. Auto-Sklearn – An automated machine learning toolkit, https://github.com/automl/auto-sklearn. Last accessed 12 December 2022 14. H2O AutoML – Open-Source Automated Machine Learning, https://h2o.ai/platform/h2o-automl/. Last accessed 12 December 2022 15. MLJAR – Automate your Machine Learning pipeline, https://mljar.com/. Last accessed 12 December 2022 16. Chen, Yi-Wei, Qingquan Song, and Xia Hu.: Techniques for automated machine learning. ACM SIGKDD Explorations Newsletter, 35-50 (2021). 17. Elshawi, Radwa, Mohamed Maher, and Sherif Sakr: Automated machine learning: State-ofthe-art and open challenges. arXiv preprint arXiv:1906.02287 (2019). 18. Vakhrushev, Anton, et al. LightAutoML: AutoML Solution for a Large Financial Services Ecosystem. arXiv preprint arXiv:2109.01528 (2021).
|