Künstliche Intelligenz Programmierung
Author Dr. D. Selzer-McKenzie
Youtube: https://youtu.be/7zx9h99-UKA
Ich erkläre hier die Klassifizierung der Algorithmen in
einem Beispiel für das Roulette, weil das Roulette sehr gut geeignet dafür ist,
Vorhersagen zu machen und die künstliche Intelligenz in Verbindung mit
neuronalen Netzen anzuwenden.
Das komplette Softwareprogramm bzw. die Handy-App können Sie
auf unserer Website kostenlos herunterladen, ebenso die Dateien mit dem
kompletten SourceCode für VisualStudio.
Die Maschine bezeichnen wir als Prädikator, weil sie eine
Eingabe übernimmt und darüber eine Vorhersage macht, wie die Ausgabe sein
sollte. Um diese Vorhersage zu verfeinern haben wir einen internen Parameter
angepasst. Dabei haben wir uns an dem Fehler orientiert, der gegenüber dem
korrekten Wert bei einem Bekannten waren Beispiel auftritt. Nehmen wir den
Ablauf eines Roulettespiels welches unterteilt ist in den Messungen der Breite
und der Länge. Die breite, das sind die einzelnen Roulettezahlen 0-36, und die
Länge, das sind die Kesselfachabstände die zwischen den einzelnen Coups in den
einzelnen Würfen entstanden sind. Es lassen sich somit ganz klar zwei Gruppen
ausmachen, die einzelnen Roulettezahlen, so wie sie im Roulettekessel
angeordnet sind, und die so genannten wurfweiten Mengen. Der Predigtor
versucht, die richtige Anzahl von Roulette Zahl für eine gegebene Anzahl von
wurfweiten Längen herauszufinden. Diese Predigttor besteht im Kern aus einer
anpasst baren linearen Funktion. Wir wissen lineare Funktionen ergeben gerade
Linien, wenn man ihre Ausgabewerte über den Eingaben etwa als Diagramm
darstellt. Der anpasstbaren Parameter hat diesen Anstieg dieser geraten
verändert. Lieber Gott, Georg Hirsch verwenden können wir nicht in der gleichen
Weise verwenden um eine Anzahl der Längen (der wurfweiten Längen) in eine
andere (Roulettezahlen) zu konvertieren, doch vielleicht können wir die Linie
nutzen, um verschiedene Arten von Dingen zu trennen. Wenn die Linie in der.
Darstellung der Roulettezahlen von den Wurf weiten Längen getrennt würden,
könnte man sie verwenden um anhand der Messwerte eine unbekannte Roulettezahl
zu klassifizieren. Diese so genannte unbekannte Roulettezahl, ist das Ziel, in die
der nächste Wurf bzw. Coup fallen soll.
Wie man sieht, sind diese Linie ganz sauber die wurfweiten
von den Roulette Zahlen, und jetzt können wir diese Linie als klassifizieren im
gesamten Roulettespiel verwenden. Wir nehmen hier an, dass es hier in dieser
Roulettewelt eben nur zwei Arten gibt, doch das ist für das erste in Ordnung,
denn wir wollen lediglich das Konzept eines einfachen klassifizierendes Modell
veranschaulichen. Stellen wir uns als nächstes vor, dass sich unserer Computer
in der Folge eine neue Roulettezahl vornimmt, seine Anordnung und seine
Wurfweite misst und es dann mithilfe der korrekten Linie als einzelne
Roulettezahl im Kessel oder als erfolgte Wurfweite klassifizieren kann. In der
Abbildung werden die Daten für ein unbekannte Roulettezahl (damit ist gemeint,
die Roulettezahl die in der Folge fallen wird) eingetragen. Es ist zweifelsfrei
eine Roulettezahl, weil der Punkt oberhalb der Linie liegt. Diese
Klassifizierung ist zwar einfach, aber schon ziemlich leistungsfähig.
Wir haben nun gesehen, wie eine lineare Funktion innerhalb
eines einfachen Prinzip Thomas genutzt werden kann, um vorher noch die nicht
gesehenen Daten zu klassifizieren. Doch wir sind über ein entscheidendes
Element hinweggegangen. Wir kommen wie kommen wir zum richtigen Kesselsektor.
Wie verbessern wir eine Linie die bekanntermaßen kein guter Teiler zwischen den
beiden Arten (Roulettezahl und Kesselwurfweite) ist. Die Antwort darauf bringt
uns wieder zu den Grundprinzipien der neuronalen Netze, und die neuronalen
Netze lernen.
Ich zeige hier wie eine einfache Klassifizierung trainiert
wird: wir wollen unsere lineare klassifizieren trainieren, um im Folge Group
die richtige Roulettezahl und die richtige Wurfweite klassifizieren zu können.
Wie wir gesehen haben es dazu lediglich der Anstieg der Trennungslinie
anzupassen, um die beiden Gruppen von Punkten in einem Diagramm mit großer
Breite und Höhe zu trennen. Anstatt im Voraus irgend eine mathematische Theorie
zu entwickeln, wollen wir uns durch Versuche voran tasten. Auf diese Weise
werden wir die Mathematik besser verstehen dazu brauchen wir einen paar
Beispiele, und zwar
Erstes Beispiel Breite 25 (Roulettezahl 25) = 3,0
Wurfweite Länge 16 = 1,0
Beispiel zwei: Breite sieben (Roulettezahl sieben) ist
gleich 1,0
Wurfweite Länge 19 = 3,0
Wir haben ein Beispiel für zwei Coups wobei der eine 3,0 und
1,0 ist und als soundsoviel Titulierung bekannt ist. Außerdem haben wir ein
Beispiel für einen Kult der mit 3,0 länger und bin 1,0 dünne ist und dass wir
als ebenfalls zurückliegenden Cooper betrachten. Bei diesem Beispiel Datensatz
wissen wir, dass er die Wahrheit widerspiegelt. Anhand solcher Beispiele lässt
sich der Anstieg der Klassifizierungsfunktion verfeinern. Wahre Beispiel für
die Lernphase eines Predigttors oder klassifizierendes werden als
Trainingsdaten bezeichnet. Wir tragen die beiden Trainingsdaten in ein Diagramm
ein und visualisieren es um es besser verstehen zu können und ein Gefühl dafür
zu bekommen. Wenn man sich lediglich eine Liste oder Tabelle mit Zahlen ansieht
ist das nicht so einfach zu erreichen. Wir beginnen mit einer zufälligen
Trennungslinie, nur um irgendwo anfangen zu können. Bei unserem Predigttor für
die Umrechnung der Wurfweite Länge hatten wir eine lineare Funktion, deren
Parameter wir anpassen. Hier können wir genauso vorgehen, weil die
Trennungslinie eine Gerade ist, also Y ist AX. Wir haben bewusst die Namen Y
und X anstelle von Wurfweite Länge und Blei verwendet, weil hier die Linie
genauso genommen kein Predigttor ist sie konvertiert nicht Roulettezahl und
Wurfweite Länge wie sie weiter oben umgerechnet wurde. Stattdessen ist sie eine
Trennungslinie einer Klassifizierungsoption. Sie sehen also dass dieses Y ist
AIX einfacher ist als die vollständige Form einer geraden: Y ist AIX plus Wurfweite
Länge.. Dieses Szenario für Roulettezahl haben wir absichtlich so einfach wie
möglich gehalten. Lässt man für die wurfweiten Länge einen Wert ungleich null
zu heißt das nur dass sie gerade nicht durch den Ursprung des Dia Gramms geht,
was in unserem Szenario nichts brauchbares beisteuert. Wie bereits zu sehen ist
steuert der Parameter A den Anstieg der geraden. Je größer aber ist desto
größer ist der Anstieg. Für den Anfang wählen wir AS 0,25. Die Gleichung der
Trennungslinie lautet dann Y ist 0,25 X. Diese Linie tragen wir in das Diagramm
der Trainingsdaten ein.
Es ist auf einem Blick zu sehen, dass die Linie Y ist 0,25 X
ohne weitere Berechnungen noch keine gute Klassifizierungsoption ist. Die
gerade teilt die beiden Arten und wir können nicht sagen, wenn die Roulettezahl
oberhalb der Linie liegt ist es die neue Roulettezahl, weil auch die Wurfweite
über der Linie liegt.
Es liegt also nahe die Linie etwas nach oben zu verschieben.
Wir widerstehen der Versuchung das zu tun, indem wir mit einem Blick auf das
Diagramm eine geeignete weitere Linie ziehen. Wir wollen ja schließlich sehen
ob wir für dieses Vorgehen ein wiederholbares Rezept finde, das heißt eine
Reihe von Computerbefehlen die als Algorithmus bezeichnet werden. Sehen wir uns
das Trainingsbeispiel nochmal an. Für eine Roulettezahl beträgt die Breite 3,0
und die Wurfweite Länge 1,0. Wenn wir die Funktion Y ist AIX mit diesem
Beispiel testen wobei X gleich 3,0 ist erhalten wir: Y ist (0,25) mal (3,0) ist
0,75.
Diese Funktion bei der der Parameter auf den zufällig
gewählten Anfangswert 0,25 gesetzt ist legt nahe das für eine Roulettezahl mit
der Breite 3,0 die Länge 0,75 betragen sollte. Wir wissen aber das das zu klein
ist weil aus den Trainingsdaten Beispiel hervorgeht dass es eine Länge von 1,0
haben muss. Wir haben also eine Differenz, also ein Fehler. Genau wie zuvor
beim Predigttor Wurfweite Länge können wir uns an diesen Fehler orientieren
wenn wir den Parameter A anpassen. Doch bevor wir das tun sollten wir noch
einmal über den Wert von Y nachdenken. Wenn Y gleich 1,0 ist verläuft die
gerade direkt durch den Punkt (X, Y ): ist (3,0:1,0). Wir wollen das eigentlich
nicht, denn die Linie soll oberhalb dieses Punktes verlaufen, weil die Punkte
für die Roulettezahl unterhalb der Linie liegen soll und nicht auf ihr. Die
gerade so eine Trennungslinie zwischen den Roulettezahl und den Wurf weiten
sein kein dritte Tor für die Länge eines Roulette Coups bei gegebener Breite
(Roulettezahl und Wurfweite Länge.
Probieren wir also, auf Y ist 1,1 abzuziehen, wenn X ist 3,0
ist. Es ist lediglich eine kleine Zahl über 1,0. Wir hätten auch 1,2 oder sogar
1,3 wählen können, doch wir wollen keine größere Zahl wie zum Beispiel zehn
oder 36, weil die gerade dabei höchstwahrscheinlich sowohl oberhalb der
Roulettezahl oder auch oberhalb der wurfweiten liegen würde, was eine
Trennungslinie ergebe, die überhaupt nicht brauchbar ist. Der gesuchte Sollwert
ist also 1,1 und der Fehler beträgt: Fehler ist (Sollwert minus Istwert), damit
haben wir: ist 1,1 - 0,75 ist 0,35.
Überlegen wir noch einmal, wir wollen den Fehler, den wir
Ihnen in Y verwenden um die erforderliche Änderung für Parameter A zu liefern.
Dazu müssen wir wissen wie die beiden miteinander in Beziehung stehen. Wie steht
aber in Beziehung zu E, und wenn wir das wüssten könnten wir auch verstehen was
sich die eine Änderung auf die andere auswirkt. Beginnen wir mit der linearen
Funktionen für den klassifizieren: Y ist AIX. Wir wissen das dies bei
anfänglichen Schätzungen wenn A die falsche Antwort für Y ergibt was den Wert
entsprechend den Trainingsdaten sein sollte. Die Korrektur zum Sollwert nennen
wir T für target value , den Sollwert. Hätten wir nur um diesen Wert die zu
erhalten, müssen wir aber um einen geringen Anstieg anpassen. Mathematiker
verwenden den griechischen ABER in der Bedeutung, eine kleine Änderung in
ausgeschrieben sieht dann so aus: T ist (A plus AA) X. Bildlich lässt sich das
ganze viel einfacher veranschaulichen. Denken Sie daran das der Fehler I die
Differenz zwischen dem korrekten Sollwert und dem Wert ist, den wir basierend
auf unseren aktuellen Schätzungen für Art berechnet haben. D.h., dass gleich
die Venus Y ist. Um das zu verdeutlichen: T ist Y ist (A plus AA) X minus AIX.
Wir erweitern und vereinfachen: die ist die minus Y ist AIX plus (AAA Lammert
zu X minus AIX somit ist (AAA) X. Das ist bemerkenswert denn der Fehler I ist
mit AA ganz einfach verknüpft. Und zwar so einfach dass man glaubt zunächst
falsch zu liegen, doch es stimmt tatsächlich. Bei dieser Algebra kann man
leicht durcheinander gekommen oder abgelegt werden. Wir wollen wissen um
welchen Betrag A anzupassen ist so dass die Linie durch den geänderten Anstieg
eine bessere Klassifizierung Option wird. Diese Berechnung soll auf Basis des
Fehlers geschehen. Dazu stellen wir einfach den letzte Gleichung klar AAA um:
AAA ist geteilt durch X.
Genau das ist es, das ist der magische Ausdruck nachdem wir
gesucht haben. Anhand des Fehlers I können wir den Anstieg A der
Klassifizierungslinie um einen Betrag AAA verfeinert. Jetzt aktualisieren wir
diesen anfänglichen Anstieg. Der Fehler hatte einen Wert von 0,35 und X war
3,0. Damit machen wir A ist geteilt durch X zu 0,35 geteilt durch 3,0 ist
0,1167. D.h. wir müssen den aktuellen Anstieg A ist 0,25 um 0,1167 ändern für
den neuen verbesserten Wert A ergibt sich also A plus AA und somit 0,25 +
0,1167 ist 0,3667. Tatsächlich ist der berechnete Wert von Y mit diesem Anstieg
A von 1,1 wie zu erwarten der gewünschte Zielwert. Nun haben wir durch diese
Methode die Technik erfasst, um den Parameter A zu verfeinern und zwar
gesteuert vom aktuellen Fehler.
Ein erstes Trainings Beispiel haben wir durch genommen, nun
wollen wir vom nächsten lernen. Hier haben wir eine bekannte Paarung von X ist
1,0 und Letzterer ist 3,0. Was passiert, wenn WX ist 1,0 in die lineare
Funktion einsetzen. Die jetzt den aktualisierten Wert von A ist 0,3667
verwendet. Wir erhalten Y ist 0,3667 × 1,0 ist 0,3667. Das liegt nur gleich gar
nicht in der Nähe des Trainingsbeispiels mit Y ist 3,0. Mit der gleichen
Argumentation wie zuvor die gerade sollen nicht in der Trainingsdaten kreuzen
sondern unmittelbar darüber oder darunter verlaufen, können wir den Sollwert
auf 2,9 setzt. Auf diese Weise liegt das Trainingsbeispiel einer Roulettezahl
unmittelbar über der Linie und nicht auf ihr. Der Fehler I beträgt 2,9 - 0,3667
ist 2,5333.
Der Fehler ist größer als zuvor, doch wenn man es recht
bedenkt hatten wir für dieses lineare Funktion Beispiel nichts weiter zum
lernen als eine einzelne Trainings Beispiel Anordnung, was zweifellos den
Verlauf der Linie in Bezug auf diesen einzelnen Beispiel Option verzerrt. Wir
aktualisieren A erneut, genau wie wir es zuvor getan haben. Die Änderung AAA
ist die geteilt durch X, was 2,5333 geteilt durch eins zu null ist 2,5333
bedeutet. D.h. dass sogar der neuere Anstieg A gleich 0,3667 + 2,5333 ist 2,9
ist. Und das bedeutet dass die Funktion für X ist 1,0 den Wert 2,0 als Antwort
liefert was dem Sollwert entspricht. Das ist schon eine ganze Menge was wir uns
erarbeitet haben was passiert wenn das Diagramm zeigt wenn der Anstieg nicht in
der Weise verbessert wird wie wir es gehofft hätten. Die Trennungslinie hat den
Bereich zwischen Roulettezahl und Wurfweite nicht ordentlich geteilt. Nun wir
haben das bekommen was wir verlangt haben. Die Linie wird ab aktualisiert um
jeden Sollwert für Y zu liefern. Was könnte daran falsch sein? Wenn wir weiter
so verfahren und den Anstieg für jedes Trainings Beispiel aktualisieren kommt
am Ende die letzte Aktualisierung lediglich dem letzten Trainings Beispiel so
nah wie möglich. Mit allen vorherigen Trennung Beispiel hätten wir uns gar
nicht herumschlagen brauchen. Praktisch verwerfen wir alle Lernerfolge die
vorherigen Trainingsbeispiele möglicherweise erzielt haben und lernen nur noch
aus dem letzten Beispiel. Wie bringen wir das nunmehr in Ordnung, und das ist
das wichtigste Konzept im maschinellen lernen. Wir moderieren die
Aktualisierungen, d.h. wir beruhigen Sie ein wenig. Anstatt enthusiastisch zu
jeden neuen Art zu sprechen nehmen wir nur ein Bruchteil der Änderung AAA und
nicht der gesamten Änderung. Auf diese Weise bewegen wir uns in die Richtung
die das Trainingsbeispiel nahelegt, aber eher zurückhaltend, wobei wir etwas
vom vorherigen wird beibehalten. Dieses Konzept der Moderation unserer
Verfeinerungen haben wir schon weiter oben gesehen bei dem einfachen Detektor
den wir um den tatsächlichen Fehler verändert haben. Diese Moderationen hat
einen anderen leistungsfähigen und nützlichen Nebeneffekt. Wenn man den Trainingsdaten
selbst nicht vollkommen vertrauen kann und diese Datenfehler oder Rauschen
enthalten was in regionalen Messungen ist kann die Moderation den Einfluss der
Fehler oder des Rauchens dämpfen. Die Moderation Klett die Effekte also das
Ganze noch einmal doch diesesmal bauen wir eine Moderation in der
Aktualisierungsformel ein: AAA ist L (geteilt durch X). Der Moderationsfaktor
wird oftmals Lernrate genannt, hiermit dem Buchstaben L gekennzeichnet. Als
akzeptablen Werte zum Einstieg wählen wir L ist 0,5. D.h., wir aktualisieren
nur halb so viel wie ohne Moderation. Wenn wir alle Schritte noch einmal
durchlaufen haben wir einen anfänglichen Wert AS 0,25. Das erste Trainings
Beispiel lieferte uns Y ist 0,25 × 3,0 ist 0,75. Für den Sollwert von 1,1 berechnet
sich der Fehler zu 0,35. Setzt man die Werte in die Formel A ist L (E geteilt
durch X) ein, ergibt sich 0,5 × 0,35 geteilt durch 3,0 ist 0,0583. Der
aktualisierte Anstieg A beträgt somit 0,25 + 0,0583 ist 0,3083. Mit dem neuen
Anstieg A erhalten wird wir für das Trainingsbeispiel bei X ist 3,0 den Wert Y
ist 0,3083 × 3,0 ist 0,9250. Die gerade liegt nun auf der falschen Seite des
Trainings Beispiel, weil der Zielwert < 1,1 ist doch ist das Ergebnis nicht
schlecht wenn man es als erstes Verfeinerung Schritt von vielen weiteren
Schritten betrachtet immerhin ging die Verschiebung in die Richtung die richtig
ist, weg von der Anfangslinie. Machen wir den zweiten Trainingsdaten Beispiel
bei X ist 1,0 weiter. Mit AS 0,3083 haben wir Y ist 0,3083 × 1,0 ist 0,3083.
Für den Sollwert 2,9 ergibt sich ein Fehler von 2,9 - 0,3083 ist 2,5917. Setzt
man den Wert in die Formel AAA ist L (E geteilt durch X) ein, erhält man 0,5 ×
2,5917 geteilt durch 1,0 ist 1,2958. Der neue geänderte Anstieg A beträgt jetzt
0,3083 + 1,2958 ist 1,6042. Wir visualisieren wieder die anfängliche die
bessere und letzte gerade, um festzustellen ob moderierte Aktualisierung zu
einer besseren Trennungslinie zwischen den Bereichen für die Roulettezahl und
die Roulette Wurfweite führen. Selbst mit diesen beiden simplen
Trainingsbeispielen und einer relativ einfachen Aktualisierungsmethode die eine
moderierte Lernrate verwendet sind wir ziemlich schnell bei einer guten
Trennungslinie der Form Y ist AIX angekommen, wobei der Anstieg A gleich 1,6042
ist. Wir wollen unsere Errungenschaften nicht kleinreden, wir haben ein
automatisierte Lernmethode entwickelt um anhand von Beispielen zu
klassifizieren angesichts der äußerst einfachen Konzepts ist diese Methode
bemerkenswert effektiv, und kann sogar im Casino mit Papier und Bleistift per
Hand ausgerechnet werden.
Sehr effektiv sind die einfachen Predigt Toren und
klassifizierte, mit denen wir bislang gearbeitet haben, die eine Eingabe
übernehmen, eine Berechnung durchführen und eine Antwort ausgeben und die wir
auf die neuronalen Netze anwenden wollen. Wir werden jetzt die Grenze eines
linearen klassifizierte es mit einem einfachen aber einleuchtenden Beispiel
veranschaulichen. Dass wir nicht in die Behandlung von neuronalen Netzen
einsteigen, ist der Grund dass sich ein wesentlicher Entwurf Feature vom
neuronalen Netzen auf das Verständnis dieser Grenze stützt, es lohnt sich also
hier etwas Zeit zu investieren. Wir wenden uns der Betrachtung der boologischen
Logikfunktion zu. Diese Funktion besagt und sein Name ist mit einfachen
Funktionen wie und oder oder verbundenn. .Boolesche elften Logikfunktionen
ähneln verknüpften Bedingungen, die wir umgangssprachlich etwa wie folgt
ausdrücken. Du darfst nur einen Stiftung setzen wenn der Kopie den
Roulettetisch freigegeben hat usw. diese Aussage enthält dies und Funktion. Das
und ist nur wahr wenn beide Bedingungen wahr sind. Es ist nicht wahr wenn nur
eine Bedingung davon wahr ist . Computer stellen die Bedingung wahr oftmals
durch den Wert eins und die Bedingung unwahr durch den Wert Null dar. Stellen
Sie sich einen einfachen linearen klassifizierte hervor, der anhand der
Trainingsdaten lernen soll, ob die Daten von einer Logikfunktion stammen. Das
ist ein natürliches und natürliches nützliches Instrument für die
Wissenschaftler die kausale Zusammenhänge oder Korrelationen zwischen
verschiedenen Beobachtungsmengen finden wollen im Diagramm ist eine gerade
eingezeichnet, die die Roten von den grünen Bereichen trennen diese Gerade ist
eine lineare Funktion die eine lineare Klassifizierung lernen kann genau wie
wir es bereits weiter oben kennen gelernt haben . Wir gehen hier nicht die
numerischen Details durch sondern praktisch gibt es viele Variationen dieser
Trennungslinie die genauso gut funktionieren doch hier geht es vor allem darum
dass eine einfache lineare Klassifizierung der Form Y ist AIX plus B in der
Lage ist die Funktion zu lernen. Diesmal ist der Punkt Null, Nullrot weil er
der Bedingung der roten Zahlen beim Roulettespiel entspricht, dass die beiden
Eingänge A und B falsch sind. Bei allen anderen Kombination ist mindestens eine
der Eingänge A oder B war, so dass der Auszug zu war wird das schöne an diesem
Diagramm ist das es klar zeigt das eine lineare Klassifizierung auch der OR
Funktion ist. Logikfunktion spielen in der Informatik eine wichtige Rolle, und
in der Tatbestand die ersten elektronischen Computer aus winzigen elektrischen
Schaltungen, die diese Logikfunktion relativ zieren. Selbst für arithmetische
Berechnungen wurden Kombinationen von Schaltungen aus simplen Logikfunktionen
verwendet. Stellen Sie sich einen einfachen linearen klassischen Vierer vor,
der anhand der Trainingsdaten lernen soll ob die Daten von einer Logikfunktion
stammen. Das ist ein natürliches und nützliches in Moment für Wissenschaftler
die kausale Zusammenhänge oder Korrelationen zwischen verschiedenen
Beobachtungsmengen finden wollen es ist tatsächlich unmöglich mit einer
einzigen geraten die Roten von den schwarzen Bereichen der zur Funktion
erfolgreich zu trennen. D.h. eine einfache lineare klassifizierte Kantor
Funktion nicht lernen wenn die Trainingsdaten von der zur Funktion stammen.
Man hat also seine Aufmerksamkeit auf die architektonischen
Unterschiede gerichtet. Herkömmliche Computer verarbeiten die Daten von allen
sequenziell und nach ziemlich konkreten Vorschriften bei ihren kalten harten
Berechnungen gibt es weder Unschärfe noch Mehrdeutigkeit. Dagegen verarbeiten
tierische gehende sowohl sie offensichtlich mit wesentlich langsameren
Taktgeschwindigkeiten laufen die Signale parallel. Es gibt zwei verschiedene
Formen von Neuronen, doch übertragen Sie alle ein elektrisches Signal von einem
Ende zum anderen von den Intrigen entlang der Aktionen zu den terminalen. Das
sehr leistungsfähige menschliche Gehirn enthält ungefähr 100 Milliarden
Neuronen. Eine Fruchtfliege besitzt lediglich 100.000 Euronen und ist damit
schon in der Lage zu fliegen zu fressen. Nahrung zu suchen und und viele andere
ziemlich komplexe Aufgaben zu erledigen. Die Anzahl von 100.000 Neuronen im
Kapazitätsbereich moderner Computer liegt könnte man doch versuchen ein solches
gehen nachzubilden. Ein Fadenwurm hat nur 302 Neuronen was gerade verschwindend
gering ist Vergleichen mit den Ressourcen heutiger Digital Rechner doch dieser
Wurm kann einige recht nützliche Aufgaben bewältigen mit denen herkömmliche
Computerprogramme von viel größerem Umfang nicht zurecht kämen. Worin liegt
also das Geheimnis. Warum sind biologische Gehirne so leistungsfähig wenn man
bedenkt dass sie verglichen mit modernen Computern wesentlich langsamer sind
und aus relativ wenigen Verarbeitungselementen bestehen. Die vollständige
Funktionsweise von gehenden wie zum Beispiel des Bewusstseins ist immer noch
ein Geheimnis. Doch weiß man inzwischen genügend über Neuronen um auf
verschiedene Arten der Verarbeitung schließen zu können. Sehen wir genauso an
wie ein Neuron funktioniert. Es übernimmt einen elektrisches Eingangssignal und
gibt ein anderes Ekel elektrisches Signal aus. Dies erinnert stark an die
Klassifizierung und Vorhersagemaschinen die wir weitergeben oben gekennzeichnet
haben und die Eingang übernehmen das Signal auf bestimmte Weise verarbeiten und
ein Ausgangssignal ausgeben. Könnten wir Neuronen als lineare Funktion
darstellen wie wir es zuvor schon getan haben. Dass diese die Ausgabe hat nicht
die Formausgabekonstante mal Eingabe plus vielleicht eine andere Konstante..
Eine Funktion dieser Eingangssignal überstimmt und ein Ausgangssignal generiert
dabei aber eine Art Schwellenwert berücksichtigt, wird Aktivierungsfunktion
genannt im mathematischen Sinn gibt es viele derartige Aktivierungsfunktionen,
die diesen Effekt erzielen wie aus dem nachstehenden Diagramm hervorgeht, ist
bei kleinen Eingabe werden die Ausgabe null nachdem aber die Eingabeschwelle
erreicht ist geht die Ausgabe sprungartig nach oben. Ein künstliches Neuronen
das sich so verhält wirkt fast wie ein reales biologisches Neuron. Der von
Wissenschaftlern verwendete Begriff beschreibt dieses Verhalten treffen, sie
sagen das Neuronenfeuer wenn die Eingabe den Schwellenwert erreicht diese
Stufenfunktion lässt sich noch verbessern. Eine solche sanften Funktionen
werden wir fortan für unsere eigenen neuronalen Netze verwenden. Forscher auf
dem Gebiet der künstlichen Intelligenz in dem auch andere ähnlich aussehende
Funktionen.
Keine Kommentare:
Kommentar veröffentlichen
Hinweis: Nur ein Mitglied dieses Blogs kann Kommentare posten.