Simple Science

La science de pointe expliquée simplement

# Informatique# Apprentissage automatique

Avancées dans l'évaluation immobilière à faibles ressources

Le nouveau cadre DoRA améliore l'évaluation des biens dans des environnements avec peu de données.

― 7 min lire


DoRA : TransformerDoRA : Transformerl’évaluation immobilièreprocessus d'évaluation immobilière.Un cadre innovant simplifie les
Table des matières

L'évaluation immobilière, c'est le process pour déterminer la valeur d'un bien. C'est super important pour plein de décisions financières, comme acheter, vendre ou louer des biens. La méthode traditionnelle d'évaluation implique des experts qui passent beaucoup de temps à analyser les propriétés. Leurs évaluations peuvent être influencées par des biais personnels et la compréhension du marché, rendant le process subjectif.

Ces dernières années, la technologie a apporté des systèmes automatisés appelés Modèles d'Évaluation Automatisés (AVM). Ces systèmes utilisent des données provenant de transactions immobilières précédentes pour estimer les valeurs des propriétés. Cependant, ils nécessitent souvent beaucoup de données et sont moins efficaces dans les zones avec peu de transactions, comme les régions nouvellement développées ou rurales.

Le défi de l'évaluation dans les zones à faibles ressources

Un gros souci dans l'évaluation immobilière, c'est le manque de données de transactions suffisantes, surtout dans les zones à faibles ressources. Ça veut dire qu'il n'y a pas assez d'exemples pour qu'un modèle puisse apprendre, rendant difficile la production d'évaluations précises. Dans ces cas-là, dépenser beaucoup de ressources pour engager des experts n'est pas pratique.

Les scénarios à faibles ressources peuvent varier. Par exemple, certaines villes peuvent avoir juste quelques transactions, tandis que d'autres peuvent n'en avoir aucune pour certains types de propriétés. Donc, il est crucial de trouver un moyen d'aider les modèles à apprendre à partir des petites données disponibles.

Méthodes et limitations actuelles

Les modèles automatisés actuels ont généralement besoin d'une quantité significative de données étiquetées. Ces données demandent une annotation soignée, ce qui peut prendre du temps et coûter cher. De plus, les modèles traditionnels dépendent fortement des transactions existantes, ce qui les rend moins adaptables aux nouvelles constructions ou aux propriétés rurales.

Les modèles automatisés existants négligent souvent des caractéristiques importantes qui peuvent influencer la valeur d'une propriété. Ils traitent généralement tous les points de données de la même manière, sans reconnaître quelles caractéristiques sont les plus pertinentes. Du coup, il reste un fossé dans l'utilisation efficace des données non étiquetées, surtout dans le cadre de l'évaluation immobilière.

Présentation de DoRA

Pour répondre à ces défis, une nouvelle approche appelée DoRA a été développée. DoRA signifie Cadre d'Apprentissage Auto-Supervisé Basé sur le Domaine pour l'Évaluation Immobilière à Faibles Ressources. Ce cadre est conçu pour apprendre des représentations à partir de données étiquetées et non étiquetées afin de faciliter l'évaluation des propriétés, surtout dans les scénarios à faibles ressources.

DoRA utilise une Phase de pré-entraînement où il apprend à partir de données immobilières non étiquetées. La clé ici, c'est la tâche intra-échantillons, qui prédit la ville où se situe une propriété en fonction de ses caractéristiques. Cette tâche aide le modèle à comprendre les données sans nécessiter beaucoup d'exemples étiquetés.

En plus, DoRA utilise l'apprentissage contrastif inter-échantillons. Ça veut dire qu'il examine les ressemblances et les différences entre les propriétés de différents endroits. En faisant ça, le modèle devient plus robuste et se prépare mieux aux applications réelles où les données peuvent être limitées.

Amélioration de l'apprentissage des représentations

DoRA se concentre sur la création d'une meilleure représentation des propriétés en utilisant diverses caractéristiques, y compris des facteurs géographiques et économiques. Ces caractéristiques fournissent une vue d'ensemble du bien, ce qui aide le modèle à faire des prédictions plus éclairées.

DoRA intègre des caractéristiques comme l'emplacement, la disposition de la propriété, l'état et les installations à proximité. Il exploite également des données externes comme des indicateurs économiques et la densité de population, qui peuvent influencer les valeurs des propriétés. Cette approche complète garantit que le modèle comprend divers aspects influençant les prix des propriétés.

Amélioration du process d'apprentissage

Le cadre innovant de DoRA peut améliorer significativement le fonctionnement des modèles de machine learning dans le domaine de l'évaluation immobilière. En combinant les phases de pré-entraînement et de fine-tuning, il apprend efficacement de ses expériences :

  1. Phase de Pré-Entraînement : Le modèle apprend à partir de données non étiquetées en utilisant la tâche intra-échantillons. Ça lui donne une base solide et une compréhension de la distribution des données.
  2. Phase de Fine-Tuning : Dans cette phase, le modèle est ajusté en utilisant un petit ensemble de données étiquetées. Ça le rend capable de faire des prédictions précises sur les évaluations des propriétés.

Ce process d'apprentissage structuré permet à DoRA de bien performer même avec des exemples étiquetés minimes, ce qui le rend adapté aux zones à faibles ressources.

Résultats de performance

Les tests sur DoRA ont montré qu'il performait mieux que les modèles existants, y compris les approches supervisées et non supervisées traditionnelles. Dans divers scénarios, y compris en mode one-shot et five-shot, DoRA a obtenu des améliorations significatives en précision de prédiction.

Ses paramètres de performance indiquent qu'il dépasse d'autres modèles en termes d'Erreur Absolue Moyenne en Pourcentage (MAPE), d'erreur absolue moyenne (MAE), et de taux de réussite à un niveau de tolérance de 10%. Ça montre que DoRA est non seulement efficace pour apprendre à partir de données limitées mais aussi capable de faire des prédictions précises dans des environnements à faibles ressources.

Applications pratiques

DoRA a été appliqué avec succès dans des scénarios réels, aidant des institutions financières comme les banques à automatiser leurs process d'évaluation immobilière. En intégrant ce cadre dans leurs systèmes, elles peuvent rapidement évaluer de nouvelles propriétés, même celles avec peu d'historiques de transactions. Ça réduit énormément le temps et les ressources dépensées sur les évaluations manuelles et minimise les influences des biais humains.

Par exemple, des acheteurs potentiels peuvent saisir des détails d'une propriété dans un système en ligne qui utilise DoRA. Le système évalue les données, y compris les installations à proximité et les conditions économiques locales, pour générer une valeur estimée de la propriété. Ça permet aux banques de proposer des options de prêt hypothécaire plus fiables et d'optimiser leurs process.

Impact dans le monde réel

L'introduction de DoRA marque un tournant vers des méthodes d'évaluation immobilière plus efficaces et précises. En réduisant la dépendance à des ensembles de données étiquetées étendus, ça permet aux institutions financières et aux entreprises d'opérer plus facilement dans diverses conditions de marché, y compris les environnements à faibles ressources.

Les praticiens financiers peuvent utiliser cette approche pour s'adapter et répondre à des marchés émergents ou à des zones nouvellement construites, assurant qu'ils restent compétitifs et informés. L'efficacité et l'objectivité globales des process d'évaluation immobilière sont améliorées, profitant à la fois aux institutions et aux clients qu'elles servent.

Conclusion

DoRA offre une solution pratique et innovante aux défis rencontrés dans l'évaluation immobilière à faibles ressources. En s'appuyant sur des techniques d'apprentissage auto-supervisé, ça permet aux modèles d'apprendre efficacement à partir de données limitées. Ce cadre aide non seulement les institutions financières, mais ouvre aussi la voie à de futurs avancements dans les systèmes d'évaluation immobilière automatisés.

Au fur et à mesure que le marché immobilier continue d'évoluer, des outils comme DoRA sont essentiels pour suivre le rythme des changements et assurer des évaluations précises à travers des lieux divers. L'accent mis sur la connaissance du domaine et des stratégies d'apprentissage solides jouera un rôle significatif dans l'avenir de l'évaluation immobilière et la prise de décision financière.

Source originale

Titre: DoRA: Domain-Based Self-Supervised Learning Framework for Low-Resource Real Estate Appraisal

Résumé: The marketplace system connecting demands and supplies has been explored to develop unbiased decision-making in valuing properties. Real estate appraisal serves as one of the high-cost property valuation tasks for financial institutions since it requires domain experts to appraise the estimation based on the corresponding knowledge and the judgment of the market. Existing automated valuation models reducing the subjectivity of domain experts require a large number of transactions for effective evaluation, which is predominantly limited to not only the labeling efforts of transactions but also the generalizability of new developing and rural areas. To learn representations from unlabeled real estate sets, existing self-supervised learning (SSL) for tabular data neglects various important features, and fails to incorporate domain knowledge. In this paper, we propose DoRA, a Domain-based self-supervised learning framework for low-resource Real estate Appraisal. DoRA is pre-trained with an intra-sample geographic prediction as the pretext task based on the metadata of the real estate for equipping the real estate representations with prior domain knowledge. Furthermore, inter-sample contrastive learning is employed to generalize the representations to be robust for limited transactions of downstream tasks. Our benchmark results on three property types of real-world transactions show that DoRA significantly outperforms the SSL baselines for tabular data, the graph-based methods, and the supervised approaches in the few-shot scenarios by at least 7.6% for MAPE, 11.59% for MAE, and 3.34% for HR10%. We expect DoRA to be useful to other financial practitioners with similar marketplace applications who need general models for properties that are newly built and have limited records. The source code is available at https://github.com/wwweiwei/DoRA.

Auteurs: Wei-Wei Du, Wei-Yao Wang, Wen-Chih Peng

Dernière mise à jour: 2023-09-14 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.00855

Source PDF: https://arxiv.org/pdf/2309.00855

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires