Ich habe einen Datensatz mit 1175 Beispielen und 21 Funktionen, die im Bereich von -1, 1 und zwei Klassen-Labels 1 und 0 sind. Da ich in den meisten Ressourcen zu lesen, ist es gut, Daten im Bereich von - 1, 1 oder 0, 1. So dachte ich, ich brauche keine Vorverarbeitung. Aber wenn ich SVM und Decision Tree Klassifikatoren von scikit-lernen, habe ich 100 Genauigkeit mit Cross-Validierung mit 10 Falten. Allerdings scheint die Klassifizierung Genauigkeit zu verringern, wie ich mehr Iterationen durchzuführen. Ich sammle diese Daten von einem Kinect-Gerät, das mir Winkel und Positionen der bestimmten Gelenke des menschlichen Körpers gibt. Wegen der Hardwarefehler bin ich sicher, dass es Rauschen auf Daten gibt. Also 100 ist fast unmöglich. Mein Datensatz ist avaiable hier gefragt Mai 8 15 am 20:27 Ich hatte den gleichen Baum mit Ihnen, die lke der Mann decson Maker handeln. Es scheint, dass dieses dataset doesn39t einen ML classfer überhaupt erfordert. Ein einfaches, wenn Regel den Job (wth korrekte Schwelle) tun wird, aber es war gut, diese Situation zu verstehen, da ich viel von dieser Art von Datenmenge habe, die ich sehen muss, wenn diese Situation existiert. So wie du mir wirklich geholfen hast. Vielen Dank ndash kobuki Nun, der Klassifikator (der Baum) noch erzählte Ihnen etwas Sinnvolles über die Form Ihrer Daten, und das ist ein großer Teil des Lernens. Da Sie glauben, dass Ihre Frage adressiert worden ist, konnten Sie meine Antwort akzeptieren ndash Matthew Drury Mai 9 15 an 16: 50Stock Vorhersage using Entscheidungsbaum Wenn youre, das hier neu ist, können Sie zu meinem RSS Zufuhr unterzeichnen möchten. Vielen Dank für Ihren Besuch Ich habe angefangen Anwendung Data Mining zu finanzieren für ein paar Monate jetzt. Ich werde Ihnen also einen Einblick in mein Hauptprojekt zur Börsenvorhersage geben. Während ich in meinem Unternehmen anfing, habe ich mehrere Projekte gesehen (so genannte 8220screener8221, d. h. basierend auf technischen Indikatoren, um Stock-Picking-Regeln zu erstellen, aber keine Verwendung von Data Mining). Die meisten von ihnen machen zwei Annahmen: Die Regeln auf der Grundlage technischer Indikatoren don8217t entwickeln sich in der Zeit Aktien werden ausgewählt (und manchmal verarbeitet) unterschiedlich je nach Branche sie gehören (z. B. Gesundheit und Pflege, Industrie, etc.) Da ich don8217t ein gutes Gefühl mit Diese beiden Annahmen, habe ich ein neues Projekt auf der Grundlage der folgenden Idee gestartet: Jeder technische Indikator kann für eine bestimmte Aktie und zu einem bestimmten Zeitpunkt zu arbeiten Dies bedeutet, dass i) Regeln auf Indikatoren sollten in der Zeit und ii) jede Aktie zu entwickeln Sollte unabhängig verarbeitet werden. Beachten Sie, dass der zweite Punkt doesn8217t bedeuten, dass es keine Korrelation zwischen einer bestimmten Aktie und dem Sektor es gehört. Es bedeutet nur, dass sich Aktien anders verhalten können und daher unabhängig behandelt werden sollten. Allerdings könnten alle Informationen aus ihrem Sektor im Prognoseprozess verwendet werden. Wenn es als Balck-Box betrachtet wird, enthält das System Informationen über einen bestimmten Bestand (wie offen, hoch, niedrig, geschlossen, Volumen usw.) als Eingabe und einen Klassenwert als Ausgabe. Die Klasse ist auf diese Weise fixiert: 1 wenn closejn gt (x closej) closej -1 sonst ist n die Differenz zwischen dem aktuellen Tag und dem vorhergesagten Tag und x ein Wert, der gewählt wird, um Transaktionsgebühren zu berücksichtigen (beachten Sie, dass ein fester Wert Auch anstelle eines Prozentsatzes gewählt werden). Die Klassenvorhersagen werden also für jeden Bestand unabhängig gemacht. Ein Jahr Tagesdaten werden für die Ausbildung und den folgenden Monat für die Prüfung verwendet. Es wird ein Fensterwechsel durchgeführt, so dass sich das System dem aktuellen Markt anpasst. Hier sind die verschiedenen Schritte der Gesamtmethodologie, die den Entscheidungsbaum für die Vorratsvorhersage nutzt: 1. Stockfilterung 2. Datenvorverarbeitung 3. Klassifizierungsbaum 4. Risikomanagement In den folgenden Beiträgen werde ich im Detail jede dieser Schritte erklären.
No comments:
Post a Comment