关键词:
估值模型
机器学习
法拍房
模型对比
摘要:
2021年1-4月,全国法拍房交易数量38774套,成交总价近750亿元,占全部二手房交易总价的近5%,法拍房产交易数量和交易总价占比与日攀升,法拍房市场在房产交易市场中的重要性水平不断提升,因此法拍房产的估值问题也应得到重视。但是学术界对于法拍房的估值问题研究仍然不足,传统估值模型存在主观性强、操作复杂、无法实现批量估值等缺陷,而机器学习方法可以很好的弥补上述不足,实现客观准确地估值,因而本文将就这一问题开展论述。本文将针对国内房地产市场中的细分市场-法拍房市场进行研究,对比不同模型在算法和运行结果上的不同,为法拍房购买方提前做好房价评估,防范由于信息不对称带来的欺诈风险提供解决方案。文章总体思路是,首先论述研究背景与研究意义,分别从宏观环境、产业环境以及领域研究背景三个层次说明本文的选题原因。其次,是对于模型搭建的理论基础和相关概念进行界定,对相关理论知识的论述解释了估值模型利用特征指标搭建的原因,对概念的界定明确了估值、估值模型以及法拍房的含义。接着,本文根据近年来的研究热点选取了其中最常用的六种房产估值机器学习模型与传统估值模型进行对比研究,得出机器学习模型的优势以及通过分析各机器学习模型在理论层面的优化,得出各模型的适用面,进一步加深了本文的研究意义和合理性。经过理论研究后,是对模型的实证研究,包括了从数据获取,到数据清洗,到模型搭建,最后模型结果展示和评价的全过程。最后一部分是对全文的研究结论和发现做了总结并客观阐述文章中的不足之处以及在未来研究中期待做的改进。相对于领域内的其他研究,本文的创新之处在于对数据项的定量分析做出了有益补充,弥补了之前研究只是进行定性分析的不足。同时,在研究对象上扩充了房产市场的细分领域,一定程度上弥补了法拍房市场的研究不足,并且运用了地图爬虫的方法,通过获取并调用百度地图专用接口批量获取地理位置,并以此为基础二次爬虫获取了周边基础设施的数据信息,以形成“一房一估值”的估值模型。本文以北京法拍房市场数据为研究样本,通过模型对比研究,得出机器学习模型相对于传统模型的优势,并发现线性回归模型的拟合精度不高,准确性较差,基于集成学习的模型在准确率上表现更好。同时,相对于随机森林,XGBoost和Light GBM的模型运行速率更高,更适用于大数据时代对处理海量的数据集的要求。