Améliorer les recommandations de formules dans les tableurs
Une nouvelle méthode améliore la façon dont les utilisateurs créent des formules dans les tableurs.
― 6 min lire
Table des matières
- Le Défi de Créer des Formules
- Exemples de Problèmes Courants
- Apprendre des Tableurs Similaires
- Identifier des Tableurs Similaires
- Comment le Système de Recommandation Fonctionne
- Étape 1 : Trouver des Feuilles Similaires
- Étape 2 : Analyser les Formules de Référence
- Étape 3 : Adapter la Formule au Contexte de l'Utilisateur
- Évaluation du Système
- Résultats de l'Évaluation
- Défis Techniques
- Identifier des Feuilles Similaires
- Problèmes de Scalabilité
- Adapter les Formules
- Conclusion
- Directions Futures
- Résumé
- Source originale
- Liens de référence
Les Tableurs sont des outils que beaucoup de gens utilisent pour manipuler des Données facilement. Ils combinent des chiffres, du texte et des fonctions comme SOMME ou NB.SI, permettant aux Utilisateurs de faire des calculs sous forme de tableau. Malgré leur popularité, écrire des Formules complexes peut être super difficile pour beaucoup d'utilisateurs, surtout ceux qui n'ont pas un fort bagage technique. Cet article va discuter de comment on peut améliorer la manière dont les formules sont recommandées dans les tableurs en utilisant des méthodes basées sur l'idée de trouver des tableurs "similaires".
Le Défi de Créer des Formules
Créer des formules dans les tableurs est souvent une tâche décourageante pour les utilisateurs du quotidien. Beaucoup de personnes ont du mal à se rappeler les différentes fonctions disponibles et comment les utiliser correctement. Par exemple, des fonctions comme NB.SI ou RECHERCHEV peuvent être compliquées à comprendre. Les utilisateurs ont généralement besoin de consulter de la documentation ou d'autres ressources pour apprendre à écrire ces formules correctement. Ce processus peut être long et frustrant.
Exemples de Problèmes Courants
Imaginons un utilisateur qui essaie de compter combien de fois un article spécifique apparaît dans une liste. Ils pourraient savoir qu'il existe une fonction appelée NB.SI, mais pas comment l'utiliser correctement. Sans aide, ils peuvent rater la création de la bonne formule, menant à des erreurs dans leurs calculs. De telles situations arrivent souvent, et elles soulignent le besoin d'un meilleur système pour aider les utilisateurs.
Apprendre des Tableurs Similaires
Une observation intéressante est que beaucoup de tableurs créés au sein de la même organisation se ressemblent souvent et utilisent des formules similaires. Ça ouvre la porte à une nouvelle approche pour aider les utilisateurs à créer des formules plus facilement.
Identifier des Tableurs Similaires
En examinant un grand nombre de tableurs, on peut trouver des paires qui sont similaires en mise en page et en fonction. Par exemple, deux tableurs peuvent servir le même but mais contenir des données différentes. Identifier ces "tableurs similaires" nous permet d'apprendre des formules existantes et d'appliquer ce savoir pour aider les utilisateurs.
Comment le Système de Recommandation Fonctionne
On a développé un système qui prédit les formules que les utilisateurs veulent créer en apprenant des formules existantes dans des tableurs similaires. Le processus peut être décomposé en plusieurs étapes.
Étape 1 : Trouver des Feuilles Similaires
La première étape consiste à scanner une collection de tableurs pour identifier lesquels ressemblent au tableur cible-où l'utilisateur veut entrer une formule. C'est un peu comme comment un logiciel de reconnaissance faciale identifie des visages qui se ressemblent.
Étape 2 : Analyser les Formules de Référence
Une fois que des feuilles similaires sont trouvées, on cherche des formules existantes à l'intérieur qui pourraient servir de référence. En examinant le Contexte autour de ces formules, on peut obtenir des insights sur comment elles ont été construites. Ce contexte inclut les données environnantes et comment elles se rapportent à la formule.
Étape 3 : Adapter la Formule au Contexte de l'Utilisateur
Après avoir trouvé une formule de référence, la dernière étape consiste à l'adapter aux besoins de l'utilisateur. Ça veut dire qu'on change les paramètres dans la formule pour correspondre aux données dans le tableur actuel de l'utilisateur. Par exemple, si la formule de référence compte des occurrences dans une autre colonne, on la modifie pour compter les occurrences dans la colonne pertinente dans le tableur de l'utilisateur.
Évaluation du Système
Pour tester à quel point ce système fonctionne bien, on l'a évalué en utilisant des données du monde réel. Plus précisément, on a collecté des milliers de tableurs pour mesurer à quel point le système pouvait prédire avec précision des formules utiles.
Résultats de l'Évaluation
Les résultats ont montré que l'utilisation de tableurs similaires améliore significativement la précision des prédictions de formules. Notre système a surpassé les méthodes existantes, notamment celles qui ne s'appuyaient que sur l'analyse du contexte du langage naturel sans prendre en compte les tableurs environnants.
Défis Techniques
Bien que l'idée semble simple, il y a plusieurs défis à surmonter.
Identifier des Feuilles Similaires
Le premier défi technique est de déterminer comment reconnaître efficacement des feuilles similaires. De simples comparaisons visuelles ne suffisent souvent pas ; on doit tenir compte des différences dans le nombre de colonnes, le nombre de lignes, et comment les données sont organisées.
Problèmes de Scalabilité
Un autre défi est de rendre le processus assez rapide pour une utilisation en temps réel. Les utilisateurs s'attendent à des suggestions rapides quand ils travaillent dans leurs tableurs. Ça veut dire que le système doit être efficace même lorsqu'il gère un grand nombre de tableurs.
Adapter les Formules
Enfin, adapter les formules de référence pour correspondre aux besoins de l'utilisateur nécessite une attention particulière pour s'assurer que les changements reflètent avec précision le nouveau contexte.
Conclusion
La méthode discutée promet une approche plus conviviale pour créer des formules dans les tableurs. En tirant parti des connaissances existantes des tableurs similaires, on peut fournir des recommandations précises qui aident les utilisateurs à éviter les pièges courants de l'écriture de formules. Ça permet non seulement de gagner du temps mais aussi de réduire la frustration, rendant l'utilisation des tableurs plus agréable pour tout le monde.
En regardant vers l'avenir, on vise à améliorer encore ce système, potentiellement en élargissant ses applications au-delà des recommandations de formules, pour inclure des tâches comme la détection d'erreurs et le remplissage de données.
Directions Futures
En regardant vers l'avenir, l'objectif est de peaufiner et d'élargir notre système, lui permettant de s'attaquer à des tâches plus complexes dans l'environnement des tableurs. Ça pourrait mener à une plus grande utilisabilité et efficacité pour les utilisateurs de divers domaines.
Résumé
En résumé, on a développé un système qui prédit les formules désirées dans les tableurs en apprenant des formules existantes dans des documents similaires. Bien qu'il y ait des défis, les bénéfices potentiels pour les utilisateurs sont significatifs, ce qui en fait un domaine prometteur pour de futures recherches et développements.
Grâce à cette approche, on peut espérer transformer la manière dont les utilisateurs du quotidien interagissent avec les tableurs, leur rendant plus facile de réaliser des calculs et des analyses complexes sans nécessiter de compétences avancées en programmation.
Titre: Auto-Formula: Recommend Formulas in Spreadsheets using Contrastive Learning for Table Representations
Résumé: Spreadsheets are widely recognized as the most popular end-user programming tools, which blend the power of formula-based computation, with an intuitive table-based interface. Today, spreadsheets are used by billions of users to manipulate tables, most of whom are neither database experts nor professional programmers. Despite the success of spreadsheets, authoring complex formulas remains challenging, as non-technical users need to look up and understand non-trivial formula syntax. To address this pain point, we leverage the observation that there is often an abundance of similar-looking spreadsheets in the same organization, which not only have similar data, but also share similar computation logic encoded as formulas. We develop an Auto-Formula system that can accurately predict formulas that users want to author in a target spreadsheet cell, by learning and adapting formulas that already exist in similar spreadsheets, using contrastive-learning techniques inspired by "similar-face recognition" from compute vision. Extensive evaluations on over 2K test formulas extracted from real enterprise spreadsheets show the effectiveness of Auto-Formula over alternatives. Our benchmark data is available at https://github.com/microsoft/Auto-Formula to facilitate future research.
Auteurs: Sibei Chen, Yeye He, Weiwei Cui, Ju Fan, Song Ge, Haidong Zhang, Dongmei Zhang, Surajit Chaudhuri
Dernière mise à jour: 2024-04-18 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2404.12608
Source PDF: https://arxiv.org/pdf/2404.12608
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://tex.stackexchange.com/a/69832/226
- https://github.com/microsoft/Auto-Formula
- https://github.com/SheetJS/enron
- https://github.com/google-research/google-research/tree/master/spreadsheet_coder
- https://drive.google.com/file/d/1C1TJPHmwlVbjbndPsT8OCs8KDfSpSrfU/view?usp=drive_link
- https://ann-benchmarks.com/index.html
- https://github.com/erikbern/ann-benchmarks