Montag, 29. Januar 2018

Künstliche Intelligenz Programmierung Author Dr. D. Selzer-McKenzie Youtube: https://youtu.be/7zx9h99-UKA Ich erkläre hier die Klassifizierung der Algorithmen in einem Beispiel für das Roulette, weil das Roulette sehr gut geeignet dafür ist, Vorhersagen zu machen und die künstliche Intelligenz in Verbindung mit neuronalen Netzen anzuwenden. Das komplette Softwareprogramm bzw. die Handy-App können Sie auf unserer Website kostenlos herunterladen, ebenso die Dateien mit dem kompletten SourceCode für VisualStudio. Die Maschine bezeichnen wir als Prädikator, weil sie eine Eingabe übernimmt und darüber eine Vorhersage macht, wie die Ausgabe sein sollte. Um diese Vorhersage zu verfeinern haben wir einen internen Parameter angepasst. Dabei haben wir uns an dem Fehler orientiert, der gegenüber dem korrekten Wert bei einem Bekannten waren Beispiel auftritt. Nehmen wir den Ablauf eines Roulettespiels welches unterteilt ist in den Messungen der Breite und der Länge. Die breite, das sind die einzelnen Roulettezahlen 0-36, und die Länge, das sind die Kesselfachabstände die zwischen den einzelnen Coups in den einzelnen Würfen entstanden sind. Es lassen sich somit ganz klar zwei Gruppen ausmachen, die einzelnen Roulettezahlen, so wie sie im Roulettekessel angeordnet sind, und die so genannten wurfweiten Mengen. Der Predigtor versucht, die richtige Anzahl von Roulette Zahl für eine gegebene Anzahl von wurfweiten Längen herauszufinden. Diese Predigttor besteht im Kern aus einer anpasst baren linearen Funktion. Wir wissen lineare Funktionen ergeben gerade Linien, wenn man ihre Ausgabewerte über den Eingaben etwa als Diagramm darstellt. Der anpasstbaren Parameter hat diesen Anstieg dieser geraten verändert. Lieber Gott, Georg Hirsch verwenden können wir nicht in der gleichen Weise verwenden um eine Anzahl der Längen (der wurfweiten Längen) in eine andere (Roulettezahlen) zu konvertieren, doch vielleicht können wir die Linie nutzen, um verschiedene Arten von Dingen zu trennen. Wenn die Linie in der. Darstellung der Roulettezahlen von den Wurf weiten Längen getrennt würden, könnte man sie verwenden um anhand der Messwerte eine unbekannte Roulettezahl zu klassifizieren. Diese so genannte unbekannte Roulettezahl, ist das Ziel, in die der nächste Wurf bzw. Coup fallen soll. Wie man sieht, sind diese Linie ganz sauber die wurfweiten von den Roulette Zahlen, und jetzt können wir diese Linie als klassifizieren im gesamten Roulettespiel verwenden. Wir nehmen hier an, dass es hier in dieser Roulettewelt eben nur zwei Arten gibt, doch das ist für das erste in Ordnung, denn wir wollen lediglich das Konzept eines einfachen klassifizierendes Modell veranschaulichen. Stellen wir uns als nächstes vor, dass sich unserer Computer in der Folge eine neue Roulettezahl vornimmt, seine Anordnung und seine Wurfweite misst und es dann mithilfe der korrekten Linie als einzelne Roulettezahl im Kessel oder als erfolgte Wurfweite klassifizieren kann. In der Abbildung werden die Daten für ein unbekannte Roulettezahl (damit ist gemeint, die Roulettezahl die in der Folge fallen wird) eingetragen. Es ist zweifelsfrei eine Roulettezahl, weil der Punkt oberhalb der Linie liegt. Diese Klassifizierung ist zwar einfach, aber schon ziemlich leistungsfähig. Wir haben nun gesehen, wie eine lineare Funktion innerhalb eines einfachen Prinzip Thomas genutzt werden kann, um vorher noch die nicht gesehenen Daten zu klassifizieren. Doch wir sind über ein entscheidendes Element hinweggegangen. Wir kommen wie kommen wir zum richtigen Kesselsektor. Wie verbessern wir eine Linie die bekanntermaßen kein guter Teiler zwischen den beiden Arten (Roulettezahl und Kesselwurfweite) ist. Die Antwort darauf bringt uns wieder zu den Grundprinzipien der neuronalen Netze, und die neuronalen Netze lernen. Ich zeige hier wie eine einfache Klassifizierung trainiert wird: wir wollen unsere lineare klassifizieren trainieren, um im Folge Group die richtige Roulettezahl und die richtige Wurfweite klassifizieren zu können. Wie wir gesehen haben es dazu lediglich der Anstieg der Trennungslinie anzupassen, um die beiden Gruppen von Punkten in einem Diagramm mit großer Breite und Höhe zu trennen. Anstatt im Voraus irgend eine mathematische Theorie zu entwickeln, wollen wir uns durch Versuche voran tasten. Auf diese Weise werden wir die Mathematik besser verstehen dazu brauchen wir einen paar Beispiele, und zwar Erstes Beispiel Breite 25 (Roulettezahl 25) = 3,0 Wurfweite Länge 16 = 1,0 Beispiel zwei: Breite sieben (Roulettezahl sieben) ist gleich 1,0 Wurfweite Länge 19 = 3,0 Wir haben ein Beispiel für zwei Coups wobei der eine 3,0 und 1,0 ist und als soundsoviel Titulierung bekannt ist. Außerdem haben wir ein Beispiel für einen Kult der mit 3,0 länger und bin 1,0 dünne ist und dass wir als ebenfalls zurückliegenden Cooper betrachten. Bei diesem Beispiel Datensatz wissen wir, dass er die Wahrheit widerspiegelt. Anhand solcher Beispiele lässt sich der Anstieg der Klassifizierungsfunktion verfeinern. Wahre Beispiel für die Lernphase eines Predigttors oder klassifizierendes werden als Trainingsdaten bezeichnet. Wir tragen die beiden Trainingsdaten in ein Diagramm ein und visualisieren es um es besser verstehen zu können und ein Gefühl dafür zu bekommen. Wenn man sich lediglich eine Liste oder Tabelle mit Zahlen ansieht ist das nicht so einfach zu erreichen. Wir beginnen mit einer zufälligen Trennungslinie, nur um irgendwo anfangen zu können. Bei unserem Predigttor für die Umrechnung der Wurfweite Länge hatten wir eine lineare Funktion, deren Parameter wir anpassen. Hier können wir genauso vorgehen, weil die Trennungslinie eine Gerade ist, also Y ist AX. Wir haben bewusst die Namen Y und X anstelle von Wurfweite Länge und Blei verwendet, weil hier die Linie genauso genommen kein Predigttor ist sie konvertiert nicht Roulettezahl und Wurfweite Länge wie sie weiter oben umgerechnet wurde. Stattdessen ist sie eine Trennungslinie einer Klassifizierungsoption. Sie sehen also dass dieses Y ist AIX einfacher ist als die vollständige Form einer geraden: Y ist AIX plus Wurfweite Länge.. Dieses Szenario für Roulettezahl haben wir absichtlich so einfach wie möglich gehalten. Lässt man für die wurfweiten Länge einen Wert ungleich null zu heißt das nur dass sie gerade nicht durch den Ursprung des Dia Gramms geht, was in unserem Szenario nichts brauchbares beisteuert. Wie bereits zu sehen ist steuert der Parameter A den Anstieg der geraden. Je größer aber ist desto größer ist der Anstieg. Für den Anfang wählen wir AS 0,25. Die Gleichung der Trennungslinie lautet dann Y ist 0,25 X. Diese Linie tragen wir in das Diagramm der Trainingsdaten ein. Es ist auf einem Blick zu sehen, dass die Linie Y ist 0,25 X ohne weitere Berechnungen noch keine gute Klassifizierungsoption ist. Die gerade teilt die beiden Arten und wir können nicht sagen, wenn die Roulettezahl oberhalb der Linie liegt ist es die neue Roulettezahl, weil auch die Wurfweite über der Linie liegt. Es liegt also nahe die Linie etwas nach oben zu verschieben. Wir widerstehen der Versuchung das zu tun, indem wir mit einem Blick auf das Diagramm eine geeignete weitere Linie ziehen. Wir wollen ja schließlich sehen ob wir für dieses Vorgehen ein wiederholbares Rezept finde, das heißt eine Reihe von Computerbefehlen die als Algorithmus bezeichnet werden. Sehen wir uns das Trainingsbeispiel nochmal an. Für eine Roulettezahl beträgt die Breite 3,0 und die Wurfweite Länge 1,0. Wenn wir die Funktion Y ist AIX mit diesem Beispiel testen wobei X gleich 3,0 ist erhalten wir: Y ist (0,25) mal (3,0) ist 0,75. Diese Funktion bei der der Parameter auf den zufällig gewählten Anfangswert 0,25 gesetzt ist legt nahe das für eine Roulettezahl mit der Breite 3,0 die Länge 0,75 betragen sollte. Wir wissen aber das das zu klein ist weil aus den Trainingsdaten Beispiel hervorgeht dass es eine Länge von 1,0 haben muss. Wir haben also eine Differenz, also ein Fehler. Genau wie zuvor beim Predigttor Wurfweite Länge können wir uns an diesen Fehler orientieren wenn wir den Parameter A anpassen. Doch bevor wir das tun sollten wir noch einmal über den Wert von Y nachdenken. Wenn Y gleich 1,0 ist verläuft die gerade direkt durch den Punkt (X, Y ): ist (3,0:1,0). Wir wollen das eigentlich nicht, denn die Linie soll oberhalb dieses Punktes verlaufen, weil die Punkte für die Roulettezahl unterhalb der Linie liegen soll und nicht auf ihr. Die gerade so eine Trennungslinie zwischen den Roulettezahl und den Wurf weiten sein kein dritte Tor für die Länge eines Roulette Coups bei gegebener Breite (Roulettezahl und Wurfweite Länge. Probieren wir also, auf Y ist 1,1 abzuziehen, wenn X ist 3,0 ist. Es ist lediglich eine kleine Zahl über 1,0. Wir hätten auch 1,2 oder sogar 1,3 wählen können, doch wir wollen keine größere Zahl wie zum Beispiel zehn oder 36, weil die gerade dabei höchstwahrscheinlich sowohl oberhalb der Roulettezahl oder auch oberhalb der wurfweiten liegen würde, was eine Trennungslinie ergebe, die überhaupt nicht brauchbar ist. Der gesuchte Sollwert ist also 1,1 und der Fehler beträgt: Fehler ist (Sollwert minus Istwert), damit haben wir: ist 1,1 - 0,75 ist 0,35. Überlegen wir noch einmal, wir wollen den Fehler, den wir Ihnen in Y verwenden um die erforderliche Änderung für Parameter A zu liefern. Dazu müssen wir wissen wie die beiden miteinander in Beziehung stehen. Wie steht aber in Beziehung zu E, und wenn wir das wüssten könnten wir auch verstehen was sich die eine Änderung auf die andere auswirkt. Beginnen wir mit der linearen Funktionen für den klassifizieren: Y ist AIX. Wir wissen das dies bei anfänglichen Schätzungen wenn A die falsche Antwort für Y ergibt was den Wert entsprechend den Trainingsdaten sein sollte. Die Korrektur zum Sollwert nennen wir T für target value , den Sollwert. Hätten wir nur um diesen Wert die zu erhalten, müssen wir aber um einen geringen Anstieg anpassen. Mathematiker verwenden den griechischen ABER in der Bedeutung, eine kleine Änderung in ausgeschrieben sieht dann so aus: T ist (A plus AA) X. Bildlich lässt sich das ganze viel einfacher veranschaulichen. Denken Sie daran das der Fehler I die Differenz zwischen dem korrekten Sollwert und dem Wert ist, den wir basierend auf unseren aktuellen Schätzungen für Art berechnet haben. D.h., dass gleich die Venus Y ist. Um das zu verdeutlichen: T ist Y ist (A plus AA) X minus AIX. Wir erweitern und vereinfachen: die ist die minus Y ist AIX plus (AAA Lammert zu X minus AIX somit ist (AAA) X. Das ist bemerkenswert denn der Fehler I ist mit AA ganz einfach verknüpft. Und zwar so einfach dass man glaubt zunächst falsch zu liegen, doch es stimmt tatsächlich. Bei dieser Algebra kann man leicht durcheinander gekommen oder abgelegt werden. Wir wollen wissen um welchen Betrag A anzupassen ist so dass die Linie durch den geänderten Anstieg eine bessere Klassifizierung Option wird. Diese Berechnung soll auf Basis des Fehlers geschehen. Dazu stellen wir einfach den letzte Gleichung klar AAA um: AAA ist geteilt durch X. Genau das ist es, das ist der magische Ausdruck nachdem wir gesucht haben. Anhand des Fehlers I können wir den Anstieg A der Klassifizierungslinie um einen Betrag AAA verfeinert. Jetzt aktualisieren wir diesen anfänglichen Anstieg. Der Fehler hatte einen Wert von 0,35 und X war 3,0. Damit machen wir A ist geteilt durch X zu 0,35 geteilt durch 3,0 ist 0,1167. D.h. wir müssen den aktuellen Anstieg A ist 0,25 um 0,1167 ändern für den neuen verbesserten Wert A ergibt sich also A plus AA und somit 0,25 + 0,1167 ist 0,3667. Tatsächlich ist der berechnete Wert von Y mit diesem Anstieg A von 1,1 wie zu erwarten der gewünschte Zielwert. Nun haben wir durch diese Methode die Technik erfasst, um den Parameter A zu verfeinern und zwar gesteuert vom aktuellen Fehler. Ein erstes Trainings Beispiel haben wir durch genommen, nun wollen wir vom nächsten lernen. Hier haben wir eine bekannte Paarung von X ist 1,0 und Letzterer ist 3,0. Was passiert, wenn WX ist 1,0 in die lineare Funktion einsetzen. Die jetzt den aktualisierten Wert von A ist 0,3667 verwendet. Wir erhalten Y ist 0,3667 × 1,0 ist 0,3667. Das liegt nur gleich gar nicht in der Nähe des Trainingsbeispiels mit Y ist 3,0. Mit der gleichen Argumentation wie zuvor die gerade sollen nicht in der Trainingsdaten kreuzen sondern unmittelbar darüber oder darunter verlaufen, können wir den Sollwert auf 2,9 setzt. Auf diese Weise liegt das Trainingsbeispiel einer Roulettezahl unmittelbar über der Linie und nicht auf ihr. Der Fehler I beträgt 2,9 - 0,3667 ist 2,5333. Der Fehler ist größer als zuvor, doch wenn man es recht bedenkt hatten wir für dieses lineare Funktion Beispiel nichts weiter zum lernen als eine einzelne Trainings Beispiel Anordnung, was zweifellos den Verlauf der Linie in Bezug auf diesen einzelnen Beispiel Option verzerrt. Wir aktualisieren A erneut, genau wie wir es zuvor getan haben. Die Änderung AAA ist die geteilt durch X, was 2,5333 geteilt durch eins zu null ist 2,5333 bedeutet. D.h. dass sogar der neuere Anstieg A gleich 0,3667 + 2,5333 ist 2,9 ist. Und das bedeutet dass die Funktion für X ist 1,0 den Wert 2,0 als Antwort liefert was dem Sollwert entspricht. Das ist schon eine ganze Menge was wir uns erarbeitet haben was passiert wenn das Diagramm zeigt wenn der Anstieg nicht in der Weise verbessert wird wie wir es gehofft hätten. Die Trennungslinie hat den Bereich zwischen Roulettezahl und Wurfweite nicht ordentlich geteilt. Nun wir haben das bekommen was wir verlangt haben. Die Linie wird ab aktualisiert um jeden Sollwert für Y zu liefern. Was könnte daran falsch sein? Wenn wir weiter so verfahren und den Anstieg für jedes Trainings Beispiel aktualisieren kommt am Ende die letzte Aktualisierung lediglich dem letzten Trainings Beispiel so nah wie möglich. Mit allen vorherigen Trennung Beispiel hätten wir uns gar nicht herumschlagen brauchen. Praktisch verwerfen wir alle Lernerfolge die vorherigen Trainingsbeispiele möglicherweise erzielt haben und lernen nur noch aus dem letzten Beispiel. Wie bringen wir das nunmehr in Ordnung, und das ist das wichtigste Konzept im maschinellen lernen. Wir moderieren die Aktualisierungen, d.h. wir beruhigen Sie ein wenig. Anstatt enthusiastisch zu jeden neuen Art zu sprechen nehmen wir nur ein Bruchteil der Änderung AAA und nicht der gesamten Änderung. Auf diese Weise bewegen wir uns in die Richtung die das Trainingsbeispiel nahelegt, aber eher zurückhaltend, wobei wir etwas vom vorherigen wird beibehalten. Dieses Konzept der Moderation unserer Verfeinerungen haben wir schon weiter oben gesehen bei dem einfachen Detektor den wir um den tatsächlichen Fehler verändert haben. Diese Moderationen hat einen anderen leistungsfähigen und nützlichen Nebeneffekt. Wenn man den Trainingsdaten selbst nicht vollkommen vertrauen kann und diese Datenfehler oder Rauschen enthalten was in regionalen Messungen ist kann die Moderation den Einfluss der Fehler oder des Rauchens dämpfen. Die Moderation Klett die Effekte also das Ganze noch einmal doch diesesmal bauen wir eine Moderation in der Aktualisierungsformel ein: AAA ist L (geteilt durch X). Der Moderationsfaktor wird oftmals Lernrate genannt, hiermit dem Buchstaben L gekennzeichnet. Als akzeptablen Werte zum Einstieg wählen wir L ist 0,5. D.h., wir aktualisieren nur halb so viel wie ohne Moderation. Wenn wir alle Schritte noch einmal durchlaufen haben wir einen anfänglichen Wert AS 0,25. Das erste Trainings Beispiel lieferte uns Y ist 0,25 × 3,0 ist 0,75. Für den Sollwert von 1,1 berechnet sich der Fehler zu 0,35. Setzt man die Werte in die Formel A ist L (E geteilt durch X) ein, ergibt sich 0,5 × 0,35 geteilt durch 3,0 ist 0,0583. Der aktualisierte Anstieg A beträgt somit 0,25 + 0,0583 ist 0,3083. Mit dem neuen Anstieg A erhalten wird wir für das Trainingsbeispiel bei X ist 3,0 den Wert Y ist 0,3083 × 3,0 ist 0,9250. Die gerade liegt nun auf der falschen Seite des Trainings Beispiel, weil der Zielwert < 1,1 ist doch ist das Ergebnis nicht schlecht wenn man es als erstes Verfeinerung Schritt von vielen weiteren Schritten betrachtet immerhin ging die Verschiebung in die Richtung die richtig ist, weg von der Anfangslinie. Machen wir den zweiten Trainingsdaten Beispiel bei X ist 1,0 weiter. Mit AS 0,3083 haben wir Y ist 0,3083 × 1,0 ist 0,3083. Für den Sollwert 2,9 ergibt sich ein Fehler von 2,9 - 0,3083 ist 2,5917. Setzt man den Wert in die Formel AAA ist L (E geteilt durch X) ein, erhält man 0,5 × 2,5917 geteilt durch 1,0 ist 1,2958. Der neue geänderte Anstieg A beträgt jetzt 0,3083 + 1,2958 ist 1,6042. Wir visualisieren wieder die anfängliche die bessere und letzte gerade, um festzustellen ob moderierte Aktualisierung zu einer besseren Trennungslinie zwischen den Bereichen für die Roulettezahl und die Roulette Wurfweite führen. Selbst mit diesen beiden simplen Trainingsbeispielen und einer relativ einfachen Aktualisierungsmethode die eine moderierte Lernrate verwendet sind wir ziemlich schnell bei einer guten Trennungslinie der Form Y ist AIX angekommen, wobei der Anstieg A gleich 1,6042 ist. Wir wollen unsere Errungenschaften nicht kleinreden, wir haben ein automatisierte Lernmethode entwickelt um anhand von Beispielen zu klassifizieren angesichts der äußerst einfachen Konzepts ist diese Methode bemerkenswert effektiv, und kann sogar im Casino mit Papier und Bleistift per Hand ausgerechnet werden. Sehr effektiv sind die einfachen Predigt Toren und klassifizierte, mit denen wir bislang gearbeitet haben, die eine Eingabe übernehmen, eine Berechnung durchführen und eine Antwort ausgeben und die wir auf die neuronalen Netze anwenden wollen. Wir werden jetzt die Grenze eines linearen klassifizierte es mit einem einfachen aber einleuchtenden Beispiel veranschaulichen. Dass wir nicht in die Behandlung von neuronalen Netzen einsteigen, ist der Grund dass sich ein wesentlicher Entwurf Feature vom neuronalen Netzen auf das Verständnis dieser Grenze stützt, es lohnt sich also hier etwas Zeit zu investieren. Wir wenden uns der Betrachtung der boologischen Logikfunktion zu. Diese Funktion besagt und sein Name ist mit einfachen Funktionen wie und oder oder verbundenn. .Boolesche elften Logikfunktionen ähneln verknüpften Bedingungen, die wir umgangssprachlich etwa wie folgt ausdrücken. Du darfst nur einen Stiftung setzen wenn der Kopie den Roulettetisch freigegeben hat usw. diese Aussage enthält dies und Funktion. Das und ist nur wahr wenn beide Bedingungen wahr sind. Es ist nicht wahr wenn nur eine Bedingung davon wahr ist . Computer stellen die Bedingung wahr oftmals durch den Wert eins und die Bedingung unwahr durch den Wert Null dar. Stellen Sie sich einen einfachen linearen klassifizierte hervor, der anhand der Trainingsdaten lernen soll, ob die Daten von einer Logikfunktion stammen. Das ist ein natürliches und natürliches nützliches Instrument für die Wissenschaftler die kausale Zusammenhänge oder Korrelationen zwischen verschiedenen Beobachtungsmengen finden wollen im Diagramm ist eine gerade eingezeichnet, die die Roten von den grünen Bereichen trennen diese Gerade ist eine lineare Funktion die eine lineare Klassifizierung lernen kann genau wie wir es bereits weiter oben kennen gelernt haben . Wir gehen hier nicht die numerischen Details durch sondern praktisch gibt es viele Variationen dieser Trennungslinie die genauso gut funktionieren doch hier geht es vor allem darum dass eine einfache lineare Klassifizierung der Form Y ist AIX plus B in der Lage ist die Funktion zu lernen. Diesmal ist der Punkt Null, Nullrot weil er der Bedingung der roten Zahlen beim Roulettespiel entspricht, dass die beiden Eingänge A und B falsch sind. Bei allen anderen Kombination ist mindestens eine der Eingänge A oder B war, so dass der Auszug zu war wird das schöne an diesem Diagramm ist das es klar zeigt das eine lineare Klassifizierung auch der OR Funktion ist. Logikfunktion spielen in der Informatik eine wichtige Rolle, und in der Tatbestand die ersten elektronischen Computer aus winzigen elektrischen Schaltungen, die diese Logikfunktion relativ zieren. Selbst für arithmetische Berechnungen wurden Kombinationen von Schaltungen aus simplen Logikfunktionen verwendet. Stellen Sie sich einen einfachen linearen klassischen Vierer vor, der anhand der Trainingsdaten lernen soll ob die Daten von einer Logikfunktion stammen. Das ist ein natürliches und nützliches in Moment für Wissenschaftler die kausale Zusammenhänge oder Korrelationen zwischen verschiedenen Beobachtungsmengen finden wollen es ist tatsächlich unmöglich mit einer einzigen geraten die Roten von den schwarzen Bereichen der zur Funktion erfolgreich zu trennen. D.h. eine einfache lineare klassifizierte Kantor Funktion nicht lernen wenn die Trainingsdaten von der zur Funktion stammen. Man hat also seine Aufmerksamkeit auf die architektonischen Unterschiede gerichtet. Herkömmliche Computer verarbeiten die Daten von allen sequenziell und nach ziemlich konkreten Vorschriften bei ihren kalten harten Berechnungen gibt es weder Unschärfe noch Mehrdeutigkeit. Dagegen verarbeiten tierische gehende sowohl sie offensichtlich mit wesentlich langsameren Taktgeschwindigkeiten laufen die Signale parallel. Es gibt zwei verschiedene Formen von Neuronen, doch übertragen Sie alle ein elektrisches Signal von einem Ende zum anderen von den Intrigen entlang der Aktionen zu den terminalen. Das sehr leistungsfähige menschliche Gehirn enthält ungefähr 100 Milliarden Neuronen. Eine Fruchtfliege besitzt lediglich 100.000 Euronen und ist damit schon in der Lage zu fliegen zu fressen. Nahrung zu suchen und und viele andere ziemlich komplexe Aufgaben zu erledigen. Die Anzahl von 100.000 Neuronen im Kapazitätsbereich moderner Computer liegt könnte man doch versuchen ein solches gehen nachzubilden. Ein Fadenwurm hat nur 302 Neuronen was gerade verschwindend gering ist Vergleichen mit den Ressourcen heutiger Digital Rechner doch dieser Wurm kann einige recht nützliche Aufgaben bewältigen mit denen herkömmliche Computerprogramme von viel größerem Umfang nicht zurecht kämen. Worin liegt also das Geheimnis. Warum sind biologische Gehirne so leistungsfähig wenn man bedenkt dass sie verglichen mit modernen Computern wesentlich langsamer sind und aus relativ wenigen Verarbeitungselementen bestehen. Die vollständige Funktionsweise von gehenden wie zum Beispiel des Bewusstseins ist immer noch ein Geheimnis. Doch weiß man inzwischen genügend über Neuronen um auf verschiedene Arten der Verarbeitung schließen zu können. Sehen wir genauso an wie ein Neuron funktioniert. Es übernimmt einen elektrisches Eingangssignal und gibt ein anderes Ekel elektrisches Signal aus. Dies erinnert stark an die Klassifizierung und Vorhersagemaschinen die wir weitergeben oben gekennzeichnet haben und die Eingang übernehmen das Signal auf bestimmte Weise verarbeiten und ein Ausgangssignal ausgeben. Könnten wir Neuronen als lineare Funktion darstellen wie wir es zuvor schon getan haben. Dass diese die Ausgabe hat nicht die Formausgabekonstante mal Eingabe plus vielleicht eine andere Konstante.. Eine Funktion dieser Eingangssignal überstimmt und ein Ausgangssignal generiert dabei aber eine Art Schwellenwert berücksichtigt, wird Aktivierungsfunktion genannt im mathematischen Sinn gibt es viele derartige Aktivierungsfunktionen, die diesen Effekt erzielen wie aus dem nachstehenden Diagramm hervorgeht, ist bei kleinen Eingabe werden die Ausgabe null nachdem aber die Eingabeschwelle erreicht ist geht die Ausgabe sprungartig nach oben. Ein künstliches Neuronen das sich so verhält wirkt fast wie ein reales biologisches Neuron. Der von Wissenschaftlern verwendete Begriff beschreibt dieses Verhalten treffen, sie sagen das Neuronenfeuer wenn die Eingabe den Schwellenwert erreicht diese Stufenfunktion lässt sich noch verbessern. Eine solche sanften Funktionen werden wir fortan für unsere eigenen neuronalen Netze verwenden. Forscher auf dem Gebiet der künstlichen Intelligenz in dem auch andere ähnlich aussehende Funktionen.


Künstliche Intelligenz Programmierung

Author Dr. D. Selzer-McKenzie






Ich erkläre hier die Klassifizierung der Algorithmen in einem Beispiel für das Roulette, weil das Roulette sehr gut geeignet dafür ist, Vorhersagen zu machen und die künstliche Intelligenz in Verbindung mit neuronalen Netzen anzuwenden.

Das komplette Softwareprogramm bzw. die Handy-App können Sie auf unserer Website kostenlos herunterladen, ebenso die Dateien mit dem kompletten SourceCode für VisualStudio.



Die Maschine bezeichnen wir als Prädikator, weil sie eine Eingabe übernimmt und darüber eine Vorhersage macht, wie die Ausgabe sein sollte. Um diese Vorhersage zu verfeinern haben wir einen internen Parameter angepasst. Dabei haben wir uns an dem Fehler orientiert, der gegenüber dem korrekten Wert bei einem Bekannten waren Beispiel auftritt. Nehmen wir den Ablauf eines Roulettespiels welches unterteilt ist in den Messungen der Breite und der Länge. Die breite, das sind die einzelnen Roulettezahlen 0-36, und die Länge, das sind die Kesselfachabstände die zwischen den einzelnen Coups in den einzelnen Würfen entstanden sind. Es lassen sich somit ganz klar zwei Gruppen ausmachen, die einzelnen Roulettezahlen, so wie sie im Roulettekessel angeordnet sind, und die so genannten wurfweiten Mengen. Der Predigtor versucht, die richtige Anzahl von Roulette Zahl für eine gegebene Anzahl von wurfweiten Längen herauszufinden. Diese Predigttor besteht im Kern aus einer anpasst baren linearen Funktion. Wir wissen lineare Funktionen ergeben gerade Linien, wenn man ihre Ausgabewerte über den Eingaben etwa als Diagramm darstellt. Der anpasstbaren Parameter hat diesen Anstieg dieser geraten verändert. Lieber Gott, Georg Hirsch verwenden können wir nicht in der gleichen Weise verwenden um eine Anzahl der Längen (der wurfweiten Längen) in eine andere (Roulettezahlen) zu konvertieren, doch vielleicht können wir die Linie nutzen, um verschiedene Arten von Dingen zu trennen. Wenn die Linie in der. Darstellung der Roulettezahlen von den Wurf weiten Längen getrennt würden, könnte man sie verwenden um anhand der Messwerte eine unbekannte Roulettezahl zu klassifizieren. Diese so genannte unbekannte Roulettezahl, ist das Ziel, in die der nächste Wurf bzw. Coup fallen soll.

Wie man sieht, sind diese Linie ganz sauber die wurfweiten von den Roulette Zahlen, und jetzt können wir diese Linie als klassifizieren im gesamten Roulettespiel verwenden. Wir nehmen hier an, dass es hier in dieser Roulettewelt eben nur zwei Arten gibt, doch das ist für das erste in Ordnung, denn wir wollen lediglich das Konzept eines einfachen klassifizierendes Modell veranschaulichen. Stellen wir uns als nächstes vor, dass sich unserer Computer in der Folge eine neue Roulettezahl vornimmt, seine Anordnung und seine Wurfweite misst und es dann mithilfe der korrekten Linie als einzelne Roulettezahl im Kessel oder als erfolgte Wurfweite klassifizieren kann. In der Abbildung werden die Daten für ein unbekannte Roulettezahl (damit ist gemeint, die Roulettezahl die in der Folge fallen wird) eingetragen. Es ist zweifelsfrei eine Roulettezahl, weil der Punkt oberhalb der Linie liegt. Diese Klassifizierung ist zwar einfach, aber schon ziemlich leistungsfähig.



Wir haben nun gesehen, wie eine lineare Funktion innerhalb eines einfachen Prinzip Thomas genutzt werden kann, um vorher noch die nicht gesehenen Daten zu klassifizieren. Doch wir sind über ein entscheidendes Element hinweggegangen. Wir kommen wie kommen wir zum richtigen Kesselsektor. Wie verbessern wir eine Linie die bekanntermaßen kein guter Teiler zwischen den beiden Arten (Roulettezahl und Kesselwurfweite) ist. Die Antwort darauf bringt uns wieder zu den Grundprinzipien der neuronalen Netze, und die neuronalen Netze lernen.



Ich zeige hier wie eine einfache Klassifizierung trainiert wird: wir wollen unsere lineare klassifizieren trainieren, um im Folge Group die richtige Roulettezahl und die richtige Wurfweite klassifizieren zu können. Wie wir gesehen haben es dazu lediglich der Anstieg der Trennungslinie anzupassen, um die beiden Gruppen von Punkten in einem Diagramm mit großer Breite und Höhe zu trennen. Anstatt im Voraus irgend eine mathematische Theorie zu entwickeln, wollen wir uns durch Versuche voran tasten. Auf diese Weise werden wir die Mathematik besser verstehen dazu brauchen wir einen paar Beispiele, und zwar



Erstes Beispiel Breite 25 (Roulettezahl 25) = 3,0



Wurfweite Länge 16 = 1,0



Beispiel zwei: Breite sieben (Roulettezahl sieben) ist gleich 1,0



Wurfweite Länge 19 = 3,0



Wir haben ein Beispiel für zwei Coups wobei der eine 3,0 und 1,0 ist und als soundsoviel Titulierung bekannt ist. Außerdem haben wir ein Beispiel für einen Kult der mit 3,0 länger und bin 1,0 dünne ist und dass wir als ebenfalls zurückliegenden Cooper betrachten. Bei diesem Beispiel Datensatz wissen wir, dass er die Wahrheit widerspiegelt. Anhand solcher Beispiele lässt sich der Anstieg der Klassifizierungsfunktion verfeinern. Wahre Beispiel für die Lernphase eines Predigttors oder klassifizierendes werden als Trainingsdaten bezeichnet. Wir tragen die beiden Trainingsdaten in ein Diagramm ein und visualisieren es um es besser verstehen zu können und ein Gefühl dafür zu bekommen. Wenn man sich lediglich eine Liste oder Tabelle mit Zahlen ansieht ist das nicht so einfach zu erreichen. Wir beginnen mit einer zufälligen Trennungslinie, nur um irgendwo anfangen zu können. Bei unserem Predigttor für die Umrechnung der Wurfweite Länge hatten wir eine lineare Funktion, deren Parameter wir anpassen. Hier können wir genauso vorgehen, weil die Trennungslinie eine Gerade ist, also Y ist AX. Wir haben bewusst die Namen Y und X anstelle von Wurfweite Länge und Blei verwendet, weil hier die Linie genauso genommen kein Predigttor ist sie konvertiert nicht Roulettezahl und Wurfweite Länge wie sie weiter oben umgerechnet wurde. Stattdessen ist sie eine Trennungslinie einer Klassifizierungsoption. Sie sehen also dass dieses Y ist AIX einfacher ist als die vollständige Form einer geraden: Y ist AIX plus Wurfweite Länge.. Dieses Szenario für Roulettezahl haben wir absichtlich so einfach wie möglich gehalten. Lässt man für die wurfweiten Länge einen Wert ungleich null zu heißt das nur dass sie gerade nicht durch den Ursprung des Dia Gramms geht, was in unserem Szenario nichts brauchbares beisteuert. Wie bereits zu sehen ist steuert der Parameter A den Anstieg der geraden. Je größer aber ist desto größer ist der Anstieg. Für den Anfang wählen wir AS 0,25. Die Gleichung der Trennungslinie lautet dann Y ist 0,25 X. Diese Linie tragen wir in das Diagramm der Trainingsdaten ein.



Es ist auf einem Blick zu sehen, dass die Linie Y ist 0,25 X ohne weitere Berechnungen noch keine gute Klassifizierungsoption ist. Die gerade teilt die beiden Arten und wir können nicht sagen, wenn die Roulettezahl oberhalb der Linie liegt ist es die neue Roulettezahl, weil auch die Wurfweite über der Linie liegt.



Es liegt also nahe die Linie etwas nach oben zu verschieben. Wir widerstehen der Versuchung das zu tun, indem wir mit einem Blick auf das Diagramm eine geeignete weitere Linie ziehen. Wir wollen ja schließlich sehen ob wir für dieses Vorgehen ein wiederholbares Rezept finde, das heißt eine Reihe von Computerbefehlen die als Algorithmus bezeichnet werden. Sehen wir uns das Trainingsbeispiel nochmal an. Für eine Roulettezahl beträgt die Breite 3,0 und die Wurfweite Länge 1,0. Wenn wir die Funktion Y ist AIX mit diesem Beispiel testen wobei X gleich 3,0 ist erhalten wir: Y ist (0,25) mal (3,0) ist 0,75.



Diese Funktion bei der der Parameter auf den zufällig gewählten Anfangswert 0,25 gesetzt ist legt nahe das für eine Roulettezahl mit der Breite 3,0 die Länge 0,75 betragen sollte. Wir wissen aber das das zu klein ist weil aus den Trainingsdaten Beispiel hervorgeht dass es eine Länge von 1,0 haben muss. Wir haben also eine Differenz, also ein Fehler. Genau wie zuvor beim Predigttor Wurfweite Länge können wir uns an diesen Fehler orientieren wenn wir den Parameter A anpassen. Doch bevor wir das tun sollten wir noch einmal über den Wert von Y nachdenken. Wenn Y gleich 1,0 ist verläuft die gerade direkt durch den Punkt (X, Y ): ist (3,0:1,0). Wir wollen das eigentlich nicht, denn die Linie soll oberhalb dieses Punktes verlaufen, weil die Punkte für die Roulettezahl unterhalb der Linie liegen soll und nicht auf ihr. Die gerade so eine Trennungslinie zwischen den Roulettezahl und den Wurf weiten sein kein dritte Tor für die Länge eines Roulette Coups bei gegebener Breite (Roulettezahl und Wurfweite Länge.



Probieren wir also, auf Y ist 1,1 abzuziehen, wenn X ist 3,0 ist. Es ist lediglich eine kleine Zahl über 1,0. Wir hätten auch 1,2 oder sogar 1,3 wählen können, doch wir wollen keine größere Zahl wie zum Beispiel zehn oder 36, weil die gerade dabei höchstwahrscheinlich sowohl oberhalb der Roulettezahl oder auch oberhalb der wurfweiten liegen würde, was eine Trennungslinie ergebe, die überhaupt nicht brauchbar ist. Der gesuchte Sollwert ist also 1,1 und der Fehler beträgt: Fehler ist (Sollwert minus Istwert), damit haben wir: ist 1,1 - 0,75 ist 0,35.

Überlegen wir noch einmal, wir wollen den Fehler, den wir Ihnen in Y verwenden um die erforderliche Änderung für Parameter A zu liefern. Dazu müssen wir wissen wie die beiden miteinander in Beziehung stehen. Wie steht aber in Beziehung zu E, und wenn wir das wüssten könnten wir auch verstehen was sich die eine Änderung auf die andere auswirkt. Beginnen wir mit der linearen Funktionen für den klassifizieren: Y ist AIX. Wir wissen das dies bei anfänglichen Schätzungen wenn A die falsche Antwort für Y ergibt was den Wert entsprechend den Trainingsdaten sein sollte. Die Korrektur zum Sollwert nennen wir T für target value , den Sollwert. Hätten wir nur um diesen Wert die zu erhalten, müssen wir aber um einen geringen Anstieg anpassen. Mathematiker verwenden den griechischen ABER in der Bedeutung, eine kleine Änderung in ausgeschrieben sieht dann so aus: T ist (A plus AA) X. Bildlich lässt sich das ganze viel einfacher veranschaulichen. Denken Sie daran das der Fehler I die Differenz zwischen dem korrekten Sollwert und dem Wert ist, den wir basierend auf unseren aktuellen Schätzungen für Art berechnet haben. D.h., dass gleich die Venus Y ist. Um das zu verdeutlichen: T ist Y ist (A plus AA) X minus AIX. Wir erweitern und vereinfachen: die ist die minus Y ist AIX plus (AAA Lammert zu X minus AIX somit ist (AAA) X. Das ist bemerkenswert denn der Fehler I ist mit AA ganz einfach verknüpft. Und zwar so einfach dass man glaubt zunächst falsch zu liegen, doch es stimmt tatsächlich. Bei dieser Algebra kann man leicht durcheinander gekommen oder abgelegt werden. Wir wollen wissen um welchen Betrag A anzupassen ist so dass die Linie durch den geänderten Anstieg eine bessere Klassifizierung Option wird. Diese Berechnung soll auf Basis des Fehlers geschehen. Dazu stellen wir einfach den letzte Gleichung klar AAA um: AAA ist geteilt durch X.



Genau das ist es, das ist der magische Ausdruck nachdem wir gesucht haben. Anhand des Fehlers I können wir den Anstieg A der Klassifizierungslinie um einen Betrag AAA verfeinert. Jetzt aktualisieren wir diesen anfänglichen Anstieg. Der Fehler hatte einen Wert von 0,35 und X war 3,0. Damit machen wir A ist geteilt durch X zu 0,35 geteilt durch 3,0 ist 0,1167. D.h. wir müssen den aktuellen Anstieg A ist 0,25 um 0,1167 ändern für den neuen verbesserten Wert A ergibt sich also A plus AA und somit 0,25 + 0,1167 ist 0,3667. Tatsächlich ist der berechnete Wert von Y mit diesem Anstieg A von 1,1 wie zu erwarten der gewünschte Zielwert. Nun haben wir durch diese Methode die Technik erfasst, um den Parameter A zu verfeinern und zwar gesteuert vom aktuellen Fehler.



Ein erstes Trainings Beispiel haben wir durch genommen, nun wollen wir vom nächsten lernen. Hier haben wir eine bekannte Paarung von X ist 1,0 und Letzterer ist 3,0. Was passiert, wenn WX ist 1,0 in die lineare Funktion einsetzen. Die jetzt den aktualisierten Wert von A ist 0,3667 verwendet. Wir erhalten Y ist 0,3667 × 1,0 ist 0,3667. Das liegt nur gleich gar nicht in der Nähe des Trainingsbeispiels mit Y ist 3,0. Mit der gleichen Argumentation wie zuvor die gerade sollen nicht in der Trainingsdaten kreuzen sondern unmittelbar darüber oder darunter verlaufen, können wir den Sollwert auf 2,9 setzt. Auf diese Weise liegt das Trainingsbeispiel einer Roulettezahl unmittelbar über der Linie und nicht auf ihr. Der Fehler I beträgt 2,9 - 0,3667 ist 2,5333.



Der Fehler ist größer als zuvor, doch wenn man es recht bedenkt hatten wir für dieses lineare Funktion Beispiel nichts weiter zum lernen als eine einzelne Trainings Beispiel Anordnung, was zweifellos den Verlauf der Linie in Bezug auf diesen einzelnen Beispiel Option verzerrt. Wir aktualisieren A erneut, genau wie wir es zuvor getan haben. Die Änderung AAA ist die geteilt durch X, was 2,5333 geteilt durch eins zu null ist 2,5333 bedeutet. D.h. dass sogar der neuere Anstieg A gleich 0,3667 + 2,5333 ist 2,9 ist. Und das bedeutet dass die Funktion für X ist 1,0 den Wert 2,0 als Antwort liefert was dem Sollwert entspricht. Das ist schon eine ganze Menge was wir uns erarbeitet haben was passiert wenn das Diagramm zeigt wenn der Anstieg nicht in der Weise verbessert wird wie wir es gehofft hätten. Die Trennungslinie hat den Bereich zwischen Roulettezahl und Wurfweite nicht ordentlich geteilt. Nun wir haben das bekommen was wir verlangt haben. Die Linie wird ab aktualisiert um jeden Sollwert für Y zu liefern. Was könnte daran falsch sein? Wenn wir weiter so verfahren und den Anstieg für jedes Trainings Beispiel aktualisieren kommt am Ende die letzte Aktualisierung lediglich dem letzten Trainings Beispiel so nah wie möglich. Mit allen vorherigen Trennung Beispiel hätten wir uns gar nicht herumschlagen brauchen. Praktisch verwerfen wir alle Lernerfolge die vorherigen Trainingsbeispiele möglicherweise erzielt haben und lernen nur noch aus dem letzten Beispiel. Wie bringen wir das nunmehr in Ordnung, und das ist das wichtigste Konzept im maschinellen lernen. Wir moderieren die Aktualisierungen, d.h. wir beruhigen Sie ein wenig. Anstatt enthusiastisch zu jeden neuen Art zu sprechen nehmen wir nur ein Bruchteil der Änderung AAA und nicht der gesamten Änderung. Auf diese Weise bewegen wir uns in die Richtung die das Trainingsbeispiel nahelegt, aber eher zurückhaltend, wobei wir etwas vom vorherigen wird beibehalten. Dieses Konzept der Moderation unserer Verfeinerungen haben wir schon weiter oben gesehen bei dem einfachen Detektor den wir um den tatsächlichen Fehler verändert haben. Diese Moderationen hat einen anderen leistungsfähigen und nützlichen Nebeneffekt. Wenn man den Trainingsdaten selbst nicht vollkommen vertrauen kann und diese Datenfehler oder Rauschen enthalten was in regionalen Messungen ist kann die Moderation den Einfluss der Fehler oder des Rauchens dämpfen. Die Moderation Klett die Effekte also das Ganze noch einmal doch diesesmal bauen wir eine Moderation in der Aktualisierungsformel ein: AAA ist L (geteilt durch X). Der Moderationsfaktor wird oftmals Lernrate genannt, hiermit dem Buchstaben L gekennzeichnet. Als akzeptablen Werte zum Einstieg wählen wir L ist 0,5. D.h., wir aktualisieren nur halb so viel wie ohne Moderation. Wenn wir alle Schritte noch einmal durchlaufen haben wir einen anfänglichen Wert AS 0,25. Das erste Trainings Beispiel lieferte uns Y ist 0,25 × 3,0 ist 0,75. Für den Sollwert von 1,1 berechnet sich der Fehler zu 0,35. Setzt man die Werte in die Formel A ist L (E geteilt durch X) ein, ergibt sich 0,5 × 0,35 geteilt durch 3,0 ist 0,0583. Der aktualisierte Anstieg A beträgt somit 0,25 + 0,0583 ist 0,3083. Mit dem neuen Anstieg A erhalten wird wir für das Trainingsbeispiel bei X ist 3,0 den Wert Y ist 0,3083 × 3,0 ist 0,9250. Die gerade liegt nun auf der falschen Seite des Trainings Beispiel, weil der Zielwert < 1,1 ist doch ist das Ergebnis nicht schlecht wenn man es als erstes Verfeinerung Schritt von vielen weiteren Schritten betrachtet immerhin ging die Verschiebung in die Richtung die richtig ist, weg von der Anfangslinie. Machen wir den zweiten Trainingsdaten Beispiel bei X ist 1,0 weiter. Mit AS 0,3083 haben wir Y ist 0,3083 × 1,0 ist 0,3083. Für den Sollwert 2,9 ergibt sich ein Fehler von 2,9 - 0,3083 ist 2,5917. Setzt man den Wert in die Formel AAA ist L (E geteilt durch X) ein, erhält man 0,5 × 2,5917 geteilt durch 1,0 ist 1,2958. Der neue geänderte Anstieg A beträgt jetzt 0,3083 + 1,2958 ist 1,6042. Wir visualisieren wieder die anfängliche die bessere und letzte gerade, um festzustellen ob moderierte Aktualisierung zu einer besseren Trennungslinie zwischen den Bereichen für die Roulettezahl und die Roulette Wurfweite führen. Selbst mit diesen beiden simplen Trainingsbeispielen und einer relativ einfachen Aktualisierungsmethode die eine moderierte Lernrate verwendet sind wir ziemlich schnell bei einer guten Trennungslinie der Form Y ist AIX angekommen, wobei der Anstieg A gleich 1,6042 ist. Wir wollen unsere Errungenschaften nicht kleinreden, wir haben ein automatisierte Lernmethode entwickelt um anhand von Beispielen zu klassifizieren angesichts der äußerst einfachen Konzepts ist diese Methode bemerkenswert effektiv, und kann sogar im Casino mit Papier und Bleistift per Hand ausgerechnet werden.

Sehr effektiv sind die einfachen Predigt Toren und klassifizierte, mit denen wir bislang gearbeitet haben, die eine Eingabe übernehmen, eine Berechnung durchführen und eine Antwort ausgeben und die wir auf die neuronalen Netze anwenden wollen. Wir werden jetzt die Grenze eines linearen klassifizierte es mit einem einfachen aber einleuchtenden Beispiel veranschaulichen. Dass wir nicht in die Behandlung von neuronalen Netzen einsteigen, ist der Grund dass sich ein wesentlicher Entwurf Feature vom neuronalen Netzen auf das Verständnis dieser Grenze stützt, es lohnt sich also hier etwas Zeit zu investieren. Wir wenden uns der Betrachtung der boologischen Logikfunktion zu. Diese Funktion besagt und sein Name ist mit einfachen Funktionen wie und oder oder verbundenn. .Boolesche elften Logikfunktionen ähneln verknüpften Bedingungen, die wir umgangssprachlich etwa wie folgt ausdrücken. Du darfst nur einen Stiftung setzen wenn der Kopie den Roulettetisch freigegeben hat usw. diese Aussage enthält dies und Funktion. Das und ist nur wahr wenn beide Bedingungen wahr sind. Es ist nicht wahr wenn nur eine Bedingung davon wahr ist . Computer stellen die Bedingung wahr oftmals durch den Wert eins und die Bedingung unwahr durch den Wert Null dar. Stellen Sie sich einen einfachen linearen klassifizierte hervor, der anhand der Trainingsdaten lernen soll, ob die Daten von einer Logikfunktion stammen. Das ist ein natürliches und natürliches nützliches Instrument für die Wissenschaftler die kausale Zusammenhänge oder Korrelationen zwischen verschiedenen Beobachtungsmengen finden wollen im Diagramm ist eine gerade eingezeichnet, die die Roten von den grünen Bereichen trennen diese Gerade ist eine lineare Funktion die eine lineare Klassifizierung lernen kann genau wie wir es bereits weiter oben kennen gelernt haben . Wir gehen hier nicht die numerischen Details durch sondern praktisch gibt es viele Variationen dieser Trennungslinie die genauso gut funktionieren doch hier geht es vor allem darum dass eine einfache lineare Klassifizierung der Form Y ist AIX plus B in der Lage ist die Funktion zu lernen. Diesmal ist der Punkt Null, Nullrot weil er der Bedingung der roten Zahlen beim Roulettespiel entspricht, dass die beiden Eingänge A und B falsch sind. Bei allen anderen Kombination ist mindestens eine der Eingänge A oder B war, so dass der Auszug zu war wird das schöne an diesem Diagramm ist das es klar zeigt das eine lineare Klassifizierung auch der OR Funktion ist. Logikfunktion spielen in der Informatik eine wichtige Rolle, und in der Tatbestand die ersten elektronischen Computer aus winzigen elektrischen Schaltungen, die diese Logikfunktion relativ zieren. Selbst für arithmetische Berechnungen wurden Kombinationen von Schaltungen aus simplen Logikfunktionen verwendet. Stellen Sie sich einen einfachen linearen klassischen Vierer vor, der anhand der Trainingsdaten lernen soll ob die Daten von einer Logikfunktion stammen. Das ist ein natürliches und nützliches in Moment für Wissenschaftler die kausale Zusammenhänge oder Korrelationen zwischen verschiedenen Beobachtungsmengen finden wollen es ist tatsächlich unmöglich mit einer einzigen geraten die Roten von den schwarzen Bereichen der zur Funktion erfolgreich zu trennen. D.h. eine einfache lineare klassifizierte Kantor Funktion nicht lernen wenn die Trainingsdaten von der zur Funktion stammen.



Man hat also seine Aufmerksamkeit auf die architektonischen Unterschiede gerichtet. Herkömmliche Computer verarbeiten die Daten von allen sequenziell und nach ziemlich konkreten Vorschriften bei ihren kalten harten Berechnungen gibt es weder Unschärfe noch Mehrdeutigkeit. Dagegen verarbeiten tierische gehende sowohl sie offensichtlich mit wesentlich langsameren Taktgeschwindigkeiten laufen die Signale parallel. Es gibt zwei verschiedene Formen von Neuronen, doch übertragen Sie alle ein elektrisches Signal von einem Ende zum anderen von den Intrigen entlang der Aktionen zu den terminalen. Das sehr leistungsfähige menschliche Gehirn enthält ungefähr 100 Milliarden Neuronen. Eine Fruchtfliege besitzt lediglich 100.000 Euronen und ist damit schon in der Lage zu fliegen zu fressen. Nahrung zu suchen und und viele andere ziemlich komplexe Aufgaben zu erledigen. Die Anzahl von 100.000 Neuronen im Kapazitätsbereich moderner Computer liegt könnte man doch versuchen ein solches gehen nachzubilden. Ein Fadenwurm hat nur 302 Neuronen was gerade verschwindend gering ist Vergleichen mit den Ressourcen heutiger Digital Rechner doch dieser Wurm kann einige recht nützliche Aufgaben bewältigen mit denen herkömmliche Computerprogramme von viel größerem Umfang nicht zurecht kämen. Worin liegt also das Geheimnis. Warum sind biologische Gehirne so leistungsfähig wenn man bedenkt dass sie verglichen mit modernen Computern wesentlich langsamer sind und aus relativ wenigen Verarbeitungselementen bestehen. Die vollständige Funktionsweise von gehenden wie zum Beispiel des Bewusstseins ist immer noch ein Geheimnis. Doch weiß man inzwischen genügend über Neuronen um auf verschiedene Arten der Verarbeitung schließen zu können. Sehen wir genauso an wie ein Neuron funktioniert. Es übernimmt einen elektrisches Eingangssignal und gibt ein anderes Ekel elektrisches Signal aus. Dies erinnert stark an die Klassifizierung und Vorhersagemaschinen die wir weitergeben oben gekennzeichnet haben und die Eingang übernehmen das Signal auf bestimmte Weise verarbeiten und ein Ausgangssignal ausgeben. Könnten wir Neuronen als lineare Funktion darstellen wie wir es zuvor schon getan haben. Dass diese die Ausgabe hat nicht die Formausgabekonstante mal Eingabe plus vielleicht eine andere Konstante.. Eine Funktion dieser Eingangssignal überstimmt und ein Ausgangssignal generiert dabei aber eine Art Schwellenwert berücksichtigt, wird Aktivierungsfunktion genannt im mathematischen Sinn gibt es viele derartige Aktivierungsfunktionen, die diesen Effekt erzielen wie aus dem nachstehenden Diagramm hervorgeht, ist bei kleinen Eingabe werden die Ausgabe null nachdem aber die Eingabeschwelle erreicht ist geht die Ausgabe sprungartig nach oben. Ein künstliches Neuronen das sich so verhält wirkt fast wie ein reales biologisches Neuron. Der von Wissenschaftlern verwendete Begriff beschreibt dieses Verhalten treffen, sie sagen das Neuronenfeuer wenn die Eingabe den Schwellenwert erreicht diese Stufenfunktion lässt sich noch verbessern. Eine solche sanften Funktionen werden wir fortan für unsere eigenen neuronalen Netze verwenden. Forscher auf dem Gebiet der künstlichen Intelligenz in dem auch andere ähnlich aussehende Funktionen.



Keine Kommentare:

Kommentar veröffentlichen

Hinweis: Nur ein Mitglied dieses Blogs kann Kommentare posten.