Was ist Data Mining? Grundlagen und seine Techniken.

Inhaltsverzeichnis:

Video: Was ist Data Mining? Grundlagen und seine Techniken.

Video: Was ist Data Mining? Grundlagen und seine Techniken.
Video: Virtuellen Computer VM unter Windows 10 erstellen | Einstieg in den Hyper-V 2024, März
Was ist Data Mining? Grundlagen und seine Techniken.
Was ist Data Mining? Grundlagen und seine Techniken.
Anonim

Das Fundament der vierten industriellen Revolution wird weitgehend davon abhängen Daten und Konnektivität. Analysis Services Dabei können Data Mining-Lösungen entwickelt oder erstellt werden. Es könnte helfen, die Ergebnisse des Kaufverhaltens von Kunden zu analysieren und vorherzusagen, um potenzielle Käufer anzusprechen. Daten werden zu einer neuen natürlichen Ressource, und der Prozess, relevante Informationen aus diesen unsortierten Daten zu extrahieren, wird immense Bedeutung erlangen. Das richtige Verständnis des Begriffs - Data Mining, ihre Prozesse und Anwendungen könnten uns dabei helfen, einen ganzheitlichen Ansatz zu diesem Schlagwort zu entwickeln.

Data Mining-Grundlagen und ihre Techniken

Image
Image

Data Mining, auch bekannt als Wissensfindung in Daten (KDD) geht es darum, große Datenbestände zu durchsuchen, um Muster und Trends aufzudecken, die über die einfache Analyse hinausgehen. Dies ist jedoch keine einstufige Lösung, sondern ein mehrstufiger Prozess, der in verschiedenen Schritten durchgeführt wird. Diese schließen ein:

1] Datenerfassung und Vorbereitung

Es beginnt mit der Datenerfassung und der richtigen Organisation. Dies verbessert die Wahrscheinlichkeit, die Informationen zu finden, die durch Data Mining ermittelt werden können

2] Modellbildung und Bewertung

Der zweite Schritt im Data Mining-Prozess ist die Anwendung verschiedener Modellierungstechniken. Diese werden verwendet, um die Parameter auf optimale Werte zu kalibrieren. Die angewandten Techniken hängen weitgehend von den analytischen Fähigkeiten ab, die erforderlich sind, um eine Reihe organisatorischer Anforderungen zu erfüllen und eine Entscheidung zu treffen.

Betrachten wir kurz einige Data Mining-Techniken. Es zeigt sich, dass die meisten Organisationen zwei oder mehr Data Mining-Techniken kombinieren, um einen geeigneten Prozess zu bilden, der ihren Geschäftsanforderungen entspricht.

Lesen: Was ist Big Data?

Data-Mining-Techniken

  1. Verband - Association ist eine der bekanntesten Data-Mining-Techniken. Unter dieser Bedingung wird ein Muster basierend auf einer Beziehung zwischen Elementen in derselben Transaktion entschlüsselt. Daher ist es auch als Relationstechnik bekannt. Einzelhändler großer Marken vertrauen auf diese Technik, um die Kaufgewohnheiten / Präferenzen der Kunden zu ermitteln. Bei der Verfolgung der Kaufgewohnheiten der Kunden stellen Einzelhändler beispielsweise fest, dass ein Kunde beim Kauf von Pralinen immer Sahne kauft, und schlagen daher vor, beim nächsten Einkauf von Pralinen auch Sahne zu kaufen.
  2. Einstufung - Diese Data-Mining-Technik unterscheidet sich von den obigen Ausführungen dadurch, dass sie auf maschinellem Lernen basiert und mathematische Techniken wie lineare Programmierung, Entscheidungsbäume, neuronales Netzwerk verwendet. Bei der Klassifizierung versuchen Unternehmen, eine Software zu entwickeln, mit der die Datenelemente in Gruppen eingeteilt werden können. Zum Beispiel kann ein Unternehmen in der Anwendung eine Klassifizierung definieren, die "angesichts aller Aufzeichnungen von Mitarbeitern, die angeboten haben, aus dem Unternehmen auszutreten, die Anzahl der Personen vorhersagt, die voraussichtlich in der Zukunft aus dem Unternehmen ausscheiden werden." Das Unternehmen kann die Aufzeichnungen der Mitarbeiter in zwei Gruppen einteilen, die „ausreisen“und „bleiben“. Anschließend kann es seine Data Mining-Software verwenden, um die Mitarbeiter in separate Gruppen einzuteilen, die zuvor erstellt wurden.
  3. Clustering - Verschiedene Objekte mit ähnlichen Eigenschaften werden durch Automatisierung in einem einzigen Cluster zusammengefasst. Viele solcher Cluster werden erstellt, indem Klassen und Objekte (mit ähnlichen Merkmalen) entsprechend platziert werden. Um dies besser zu verstehen, betrachten wir ein Beispiel für die Buchverwaltung in der Bibliothek. In einer Bibliothek ist die umfangreiche Büchersammlung vollständig katalogisiert. Artikel desselben Typs werden zusammen aufgelistet. Dies erleichtert es uns, ein Buch von Interesse zu finden. In ähnlicher Weise können wir mithilfe der Clustering-Technik Bücher mit Ähnlichkeiten in einem Cluster zusammenfassen und diesem einen geeigneten Namen zuweisen. Wenn also ein Leser ein Buch sucht, das für sein Interesse relevant ist, muss er nur zu diesem Regal gehen, anstatt die gesamte Bibliothek zu durchsuchen. Daher definiert die Clustering-Technik die Klassen und ordnet Objekte in jede Klasse ein, während bei den Klassifizierungstechniken Objekte vordefinierten Klassen zugeordnet werden.
  4. Prognose - Die Vorhersage ist eine Data-Mining-Technik, die häufig in Kombination mit den anderen Data-Mining-Techniken verwendet wird. Dabei werden Trends, Klassifizierung, Musterabgleich und Beziehungen analysiert. Durch die Analyse vergangener Ereignisse oder Instanzen in einer richtigen Reihenfolge kann ein zukünftiges Ereignis sicher vorhergesagt werden. Zum Beispiel kann die Vorhersageanalyse-Technik im Verkauf verwendet werden, um den zukünftigen Gewinn vorherzusagen, wenn der Verkauf als unabhängige Variable und der Gewinn als vom Verkauf abhängige Variable ausgewählt wird. Basierend auf den historischen Verkaufs- und Gewinndaten kann dann eine angepasste Regressionskurve gezeichnet werden, die für die Gewinnprognose verwendet wird.
  5. Entscheidungsbäume - Innerhalb des Entscheidungsbaums beginnen wir mit einer einfachen Frage, die mehrere Antworten enthält. Jede Antwort führt zu einer weiteren Frage, mit deren Hilfe die Daten klassifiziert oder identifiziert werden können, sodass sie kategorisiert werden können oder dass auf jeder Antwort eine Vorhersage getroffen werden kann. Zum Beispiel verwenden wir den folgenden Entscheidungsbaum, um zu bestimmen, ob Cricket-ODI gespielt werden soll: Data Mining-Entscheidungsbaum: Wenn der Wetterknoten vom Wurzelknoten aus vorhergesagt wird, sollten wir die Übereinstimmung des Tages vermeiden. Alternativ, wenn die Wettervorhersage klar ist, sollten wir das Spiel spielen.

Data Mining steht im Mittelpunkt der Analyseanstrengungen in einer Vielzahl von Branchen und Disziplinen wie Kommunikation, Versicherung, Bildung, Herstellung, Bankwesen und Einzelhandel. Daher ist es wichtig, korrekte Informationen darüber zu haben, bevor Sie die verschiedenen Techniken anwenden.

Empfohlen: