Ich erstelle eine Reihe von Schachpositionen, die [als Datensatz] für ein Projekt verwendet werden sollen. Es basiert auf überwachtem maschinellem Lernen , aber ich muss Daten beschriftet haben (siehe mehr kursiven Text unten), bevor maschinelles Lernen durchgeführt werden kann. Ich möchte jede Position als offen oder geschlossen oder möglicherweise als eine Kombination aus beiden kennzeichnen.
Ich begann damit, jede Position nur "offen" oder "geschlossen" zuzuweisen, aber dies war für a nicht klar viele der Positionen. Dann entschied ich mich für ein drittes Etikett, halb offen / halb geschlossen, das wie die Mitte ist und zwischen offen und geschlossen liegt. Ich habe die meisten Positionen beschriftet, aber es gibt viele Positionen, die ich noch nicht bequem mit einer bestimmten Klasse beschriftet habe.
Ich weiß, dass offene Positionen dadurch gekennzeichnet sind, dass sie bauernlose Ränge, Dateien und Diagonalen haben , während geschlossene Positionen sie mit Bauern verstopft haben. In offenen Positionen können Sie Ihre Teile normalerweise zentralisieren, während es in geschlossenen Positionen schwierig ist, ein beliebiges Teil an eine zufällige Stelle auf dem Brett zu verschieben. Es gibt viele andere verwandte Muster, Merkmale und Eigenschaften.
Ich kann leicht mit meinem Bauchgefühl weitermachen, wenn ich einer Position mit 7 Bauern auf jeder Seite "geschlossen" zuordne Jeder Bauer blockiert einen anderen und "öffnet" sich zu einer Position, die nur an den Flanken und auf ihren Startfeldern Bauern hat. Es fällt mir jedoch schwer, einige Positionen wie diese beiden Beispiele zu klassifizieren:
[Weiß "Position1"] [Schwarz "Offen / Halb / Geschlossen / Etc"] [FEN "8 / 5Qpk / p6p / P1b5 / 4pPn1 / 2Pp3P / 1P1BbqP1 / R3R2K w - - 0 1 "]
[Weiß" Position2 "] [Schwarz" Offen / Halb / Geschlossen / Etc "] [FEN" 3r1rk1 / pp2pp1p / 2p3pb / 2P5 / 4P3 / 4nNPb / PP2P2P / R1RNK2B w - - 0 1 "]
Was würden Sie den obigen Beispielen zuweisen und warum ? Beispiel: Eine Position ist aufgrund des Merkmals XYZ offener als die andere, oder die zweite Position sollte nicht als geschlossen betrachtet werden, da eine Datei geöffnet ist usw.
Sollte ich einfach die gesamte binäre Kennzeichnung ( Klassifizierung ) fallen lassen und stattdessen eine variable Nummer ( Regression ) zuweisen, die beschreibt, wie offen oder geschlossen eine Position ist (z. B. 0) % bis 100% offen?) Oder gibt es noch eine Möglichkeit, Positionen in einige Kategorien einzuteilen, was bedeutet, dass wir "strenge" Definitionen der Kategorien der Offenheit haben können? Und "rigoros", da es nur wenige Widersprüche gibt und vorzugsweise von einem Menschen ohne allzu große Schwierigkeiten angewendet werden kann.