Die Vorhersage des Erfolgs von Startups mit Daten und Machine Learning
Datenanalyse nutzen, um vielversprechende Startups vor der Investition zu identifizieren.
― 6 min Lesedauer
Inhaltsverzeichnis
Vorhersagen, ob ein Startup erfolgreich sein wird, ist echt hart. Viele neue Unternehmen scheitern innerhalb von ein paar Jahren, weshalb es für Investoren wichtig ist, herauszufinden, welche die besten Chancen haben. Mit dem Aufkommen grosser Datenbanken wie Crunchbase ist es jetzt möglich, Daten und maschinelles Lernen zu nutzen, um den Erfolg von Startups besser vorherzusagen. In diesem Artikel geht's darum, wie diese Methoden helfen können, Startups mit starkem Potenzial in ihren frühen Investitionsrunden zu erkennen.
Warum die Vorhersage des Startup-Erfolgs wichtig ist
Startups spielen eine riesige Rolle in der Wirtschaft. Sie schaffen Arbeitsplätze und treiben Innovationen voran. Allerdings scheitern rund 90 % von ihnen in den ersten fünf Jahren. Das macht es umso wichtiger, genau vorherzusagen, welche Startups eher erfolgreich sind. Investoren können diese Vorhersagen nutzen, um ihr Geld klug einzusetzen. Genauso können Unternehmer davon profitieren, zu verstehen, welche Faktoren ihre Erfolgswahrscheinlichkeit beeinflussen.
Nutzung von Crunchbase-Daten
Crunchbase ist eine Datenbank, die Informationen über Startups bereitstellt, einschliesslich ihrer Finanzierungsphasen, Bewertungen und Investorendetails. Maschinelle Lernmodelle können diese Daten analysieren und Muster finden, die auf den zukünftigen Erfolg eines Startups hindeuten, basierend auf Faktoren wie Finanzierungshistorie, Teamstruktur und Markttrends.
In dieser Studie werden zwei Hauptmethoden zur Vorhersage des Startup-Erfolgs verwendet: ein überwachter maschineller Lernansatz und ein rangbasierten Ansatz. Die erste Methode beinhaltet das Sammeln von Daten, das Trainieren eines Modells und das Testen. Die zweite Methode konzentriert sich darauf, Merkmale zu identifizieren, die erfolgreiche Startups und Investoren gemeinsam haben.
Aufbau eines Datensatzes
Um ein effektives Modell zu erstellen, braucht man einen Datensatz mit umfangreichen Informationen über Startups. Für diese Forschung wurden über 34.000 Unternehmen analysiert, wobei besonders auf die Finanzierungsphasen Series B und C geachtet wurde. Ein erfolgreiches Startup wird definiert als eines, das einen Börsengang (IPO) erreicht, übernommen wird oder ein Einhorn (ein Unternehmen mit einer Bewertung von über einer Milliarde Dollar) wird.
Um erfolgreiche Unternehmen zu erkennen, wurde der Datensatz nach IPOs und Übernahmen gefiltert, was zu einer Liste von 1.074 Einhörnern führte. Daraufhin wurde ein Datensatz von erfolglosen Startups erstellt, indem die bereits als erfolgreich klassifizierten Unternehmen ausgeschlossen wurden. Das Ergebnis war eine Sammlung von etwa 32.760 erfolgslosen Firmen.
Verständnis der Merkmale
Das Modell nutzt verschiedene Merkmale, um Vorhersagen zu treffen. Merkmale können folgendermassen kategorisiert werden:
Merkmale der Gründer
- Kategorial: Beinhaltet Aspekte wie Ländercode, Region und Bildungsweg.
- Numerisch: Stellt Daten wie die Anzahl vorheriger Startups und Social-Media-Profile dar.
Merkmale der Investoren
- Kategorial: Beinhaltet die Art des Investors und deren Standort.
- Numerisch: Umfasst die gesamte Höhe der bereitgestellten Finanzierung.
Merkmale der Runden
- Kategorial: Repräsentiert Aspekte wie Investitionsart und Namen der Investoren.
- Numerisch: Bezieht sich auf Summen, Mittelwerte und Maximalbeträge in Bezug auf die Finanzierung.
Das Modell nutzt auch Textdaten, wie Schlüsselwörter, die mit dem Tätigkeitsfeld des Startups zusammenhängen, um zusätzliche Merkmale zu erstellen. Diese Text-Tags helfen, ein klareres Bild vom Fokus des Unternehmens zu bekommen.
Modelltraining und -tests
Das Modell wird mit historischen Daten trainiert und über einen bestimmten Zeitraum getestet. In der Trainingsphase werden nur Daten von Unternehmen verwendet, die vor Beginn des Testzeitraums gegründet wurden. Diese Methode verhindert, dass das Modell Kenntnisse über zukünftige Ereignisse hat, die die Ergebnisse verzerren könnten.
Es wurden mehrere Simulationen durchgeführt, die es dem Modell ermöglichten, seine Vorhersagen basierend auf dem wachsenden Datensatz zu verbessern. Die Ergebnisse dieser Simulationen helfen, ein Portfolio vorhergesagter erfolgreicher Startups zu erstellen.
Portfoliosimulation
Ein wichtiger Teil dieser Forschung ist die Simulation der Betriebsabläufe eines Venture-Capital-Fonds über mehrere Jahre. Das Modell durchläuft die Daten immer wieder und wählt jeden Monat die besten Unternehmen aus, um ein Portfolio zu bilden.
Jedes Unternehmen, das dem Portfolio hinzugefügt wird, wird genau überwacht. Firmen werden als erfolgreich eingestuft, wenn sie ein Exit-Ereignis wie einen Börsengang oder eine Übernahme erreichen. Wenn ein Unternehmen über einen längeren Zeitraum keine Finanzierung anziehen kann, wird es ebenfalls markiert und aus dem Portfolio entfernt.
Dieser Prozess ermöglicht eine klare Bewertung, wie das Modell über die Zeit hinweg abschneidet und wie effektiv es darin ist, erfolgreiche Startups auszuwählen.
Messung des finanziellen Wachstums
Um die Leistung des Modells zu bewerten, werden traditionelle finanzielle Kennzahlen verwendet. Ziel ist es, das Kapitalwachstum basierend auf den Startups im Portfolio zu verfolgen. Unternehmen werden anhand ihrer Bewertungen zum Zeitpunkt des Eintritts und des Ausstiegs bewertet.
Das Modell zeigt letztendlich ein erhebliches Kapitalwachstum, das durch die sorgfältige Auswahl von Startups mit hohem Potenzial erreicht wurde. Diese finanzielle Kennzahl zeigt, wie effektiv das Modell darin ist, vielversprechende Investitionen zu identifizieren.
Lektionen aus den Ergebnissen
Die Ergebnisse aus Tests und Simulationen zeigen, dass datengestützte Methoden die Vorhersage des Startup-Erfolgs erheblich unterstützen. Schlüsselfaktoren sind die Analyse einer Vielzahl von Merkmalen und die kontinuierliche Aktualisierung des Modells mit neuen Daten.
Die Forschung hebt auch die Bedeutung hervor, zu verstehen, welche Merkmale am einflussreichsten sind, um den Erfolg vorherzusagen, wie zum Beispiel den Hintergrund der Gründer und die Art der involvierten Investoren.
Zukünftige Entwicklungen
Es gibt zahlreiche Möglichkeiten, das Modell zu verbessern. Zum Beispiel könnten zusätzliche Datenquellen, wie die Aktivität in sozialen Medien, mehr Einblicke in das Potenzial eines Unternehmens bieten. Die Definition von Erfolg zu erweitern, könnte helfen, mehr Startups einzubeziehen, die in eine Grauzone fallen.
Es könnte auch von Vorteil sein, mit verschiedenen Schwellenwerten zu experimentieren, um zu entscheiden, welche Unternehmen dem Portfolio hinzugefügt werden sollen. Die Feinabstimmung dieser Parameter könnte zu einer besseren Leistung und genaueren Vorhersagen führen.
Ein weiterer wichtiger Bereich für künftige Untersuchungen ist das Verständnis, wie makroökonomische Faktoren Startups beeinflussen. Das würde helfen, Risiken und Chancen zu erkennen, die Investitionsentscheidungen beeinflussen könnten.
Fazit
Mit der wachsenden Rolle von Daten und maschinellem Lernen im Venture Capital können Investoren durch den Einsatz dieser prognostischen Modelle einen erheblichen Vorteil erlangen. Die Fähigkeit, genau vorherzusagen, welche Startups wahrscheinlich erfolgreich sein werden, führt zu besseren Investitionsentscheidungen. Während sich das Umfeld weiterentwickelt, wird weitere Forschung und Entwicklung an diesen Modellen deren Effektivität im dynamischen Startup-Ökosystem nur verbessern.
Durch die Nutzung umfassender Datensätze und fortschrittlicher Analysen können Venture Capitalists ihre Chancen erhöhen, die nächste grosse Erfolgsgeschichte zu entdecken, was letztlich zu einem gesünderen Startup-Umfeld und wirtschaftlichem Wachstum beiträgt.
Titel: Startup success prediction and VC portfolio simulation using CrunchBase data
Zusammenfassung: Predicting startup success presents a formidable challenge due to the inherently volatile landscape of the entrepreneurial ecosystem. The advent of extensive databases like Crunchbase jointly with available open data enables the application of machine learning and artificial intelligence for more accurate predictive analytics. This paper focuses on startups at their Series B and Series C investment stages, aiming to predict key success milestones such as achieving an Initial Public Offering (IPO), attaining unicorn status, or executing a successful Merger and Acquisition (M\&A). We introduce novel deep learning model for predicting startup success, integrating a variety of factors such as funding metrics, founder features, industry category. A distinctive feature of our research is the use of a comprehensive backtesting algorithm designed to simulate the venture capital investment process. This simulation allows for a robust evaluation of our model's performance against historical data, providing actionable insights into its practical utility in real-world investment contexts. Evaluating our model on Crunchbase's, we achieved a 14 times capital growth and successfully identified on B round high-potential startups including Revolut, DigitalOcean, Klarna, Github and others. Our empirical findings illuminate the importance of incorporating diverse feature sets in enhancing the model's predictive accuracy. In summary, our work demonstrates the considerable promise of deep learning models and alternative unstructured data in predicting startup success and sets the stage for future advancements in this research area.
Autoren: Mark Potanin, Andrey Chertok, Konstantin Zorin, Cyril Shtabtsovsky
Letzte Aktualisierung: 2023-09-27 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2309.15552
Quell-PDF: https://arxiv.org/pdf/2309.15552
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.