The K Desktop Environment

Weiter Zurück Inhaltsverzeichnis

4. Algorithmen

alg



Algorithmen

Gematria

Im Hebräischen hat jder Buchstabe einen Zahlenwert der für derartige Betrachtungen herangezogen wird. Die Berrechnung von Gematriasummen erfolgt für die Unterschiedlichen Berechnungsarten gleichzeitig und wird je nach gewählter Darstellung (Karteikarte Text/Gematria) als Summe des Verses, der Zeile oder Spalte in einer Liste ausgewiesen. Dabei gelten für die 6 Spalten in den Listen folgende Zuordnungen.



Buchstaben Absolut Atbash(revers) Reduziert Ordinal Quadrat Reduz.Atbash
Aleph 1 400 1 1 1 9
Beth 2 300 2 2 4 8
Gimel 3 200 3 3 9 7
Daleth 4 100 4 4 16 6
He 5 90 5 5 25 5
Waw 6 80 6 6 36 4
Zajin 7 70 7 7 49 3
Chet 8 60 8 8 64 2
Tet 9 50 9 9 81 1
Jod 10 40 1 10 100 90
Kaph 20 30 2 11 121 80
Lamed 30 20 3 12 144 70
Mem 40 10 4 13 169 60
Nun 50 9 5 14 196 50
Samech 60 8 6 15 225 40
Ajin 70 7 7 16 256 30
Pe 80 6 8 17 289 20
Sade 90 5 9 18 324 10
Qoph 100 4 1 19 361 400
Resch 200 3 2 20 400 300
Sin/Schin 300 2 3 21 441 200
Taw 400 1 4 22 484 100


Intervall

Die statistische Erwartung

Im Kopfteil der Liste der Intervalle wird zu den gefundenen Intervallen zum Vergleich der statistische Erwartungswert aufgezeigt. Der Wert ergibt sich aus dem Produkt der Einzelwarscheinlichkeiten \( EW \) der am Wort beteiligten Buchstaben multipliziert mit der Anzahl der Versuche ein Intervall zu finden. Dazu wird die Anzahl \( Anz \) der beteiligten Buchstaben in der Menge des ausgewählten Textes ermittelt und durch die Anzahl aller Buchstaben \( Ges \) des ausgewählten Textes geteilt.

\( EW_{b}=\frac{Anz_{b}}{Ges} \);

für \( b \) gilt ein beliebiger Buchstabe des hebr. Alphabets. Die Warscheinlichkeit \( IW \) für das Auftretens eines Intervallwortes ergibt sich aus

\( IW=EW_{b_{[1]}}*EW_{b_{[2]}}*...*EW_{b_{[n]}} \) ;

\( 1..n \) sind die Buchstaben aus denen sich das Wort zusammensetzt. \( IW \) ist somit die Warscheinlichkeit für das Auftreten eines Intervalles wenn ich aus dem Text \( n \) beliebige Buchstaben auswähle. Die Anzahl der Versuche \( AV \) wird aus der Gesamtmenge der Buchstaben im Text wie folgt ermittelt.

\( \sum AV=Ges-((n-1)*I_{[j...k]}) \)

Wobei \( I \) die Intervallweite mit \( j \) als Beginn und \( k \) als Ende des Intervallbereiches ist. Als statistischer Erwartungswert \( SW \) gilt somit

\( SW=AV*IW \) ;

Der Maximalbereich

Unter dem Maximalbereich eines Intervalls wird jener Textbereich verstanden in den das Intervall eingebettet ist, und kein kleineres Intervall des untersuchten Wortes zu finden ist. Er wird als Prozentwert zu der Gesamtmenge des Textes angegeben. Bei dem kleinsten Intervall für das Wort ist er immer 100%. In grossen Intervallmengen bei hohen Intervallweiten in der Regel Null.

Die Differenz zur statistischen Erwartung

In der Liste 'ana2' wird die Differenz der gefundenen Intervalle zur statistischen Erwartung graphisch dargestellt. Dazu wird der Text des Buches in gleich grosse Abschnitte geteilt. Die Länge eines Abschnitts \( LA \) wird so gewählt das Intervalle bis zu einer Intervallweite von maximal 200 untersucht werden können.

\( LA=200*(n-1) \)

\( n \) ist dabei die Anzahl Buchstaben des Intervallwortes.

Für den Abschnitt wird der statistische Erwartungswert ermittelt und die Anzahl der tatsächlich gefunden Intervalle gegengerechnet. Die Differenz wird als Balken je Abschnitt dargestellt.

Die Startpunkte von Intervallen

In der Liste 'ana3' werden die untersuchten Abschnitte als Balken dargestellt. Auch hier gilt

\( LA=200*(n-1) \)

für die Länge eines Abschnittes. Die Höhe des Balkens ist die Anzahl der Startpunkte von Intervallen in diesem Abschnitt.

Der Vergleich mit zufällig gebildeten Buchstabenfolgen.

In Liste 'ana5' wird ein Vergleich zwischen dem untersuchten Intervallwort und 5 Buchstabenfolgen welche durch vertauschen von Buchstaben des Intervallwortes gewonnen werden. Die Reihenfolge des Vertauschens ist willkürlich gewählt. Es wird dabei nicht geprüft ob eine Buchstabenfolge der vertauschten Buchstaben ein anderes gültiges Wort ergibt. Folge 1 entspricht dabei immer dem untersuchten Intervallwort.



Wort mit 3 4 5 6 7 Buchstaben
Folge 1 1,2,3 1,2,3,4 1,2,3,4,5 1,2,3,4,5,6 1,2,3,4,5,6,7
Folge 2 1,3,2 1,3,4,2 2,4,1,3,5 2,4,6,5,1,3 2,7,6,4,5,1,3
Folge 3 2,3,1 2,3,1,4 3,2,5,1,3 3,5,2,6,4,1 3,5,4,7,6,2,1
Folge 4 2,1,3 2,4,1,3 4,1,2,5,3 4,6,3,1,2,5 4,7,5,6,1,3,2
Folge 5 3,1,2 3,2,4,1 5,4,1,3,2 5,1,4,6,2,3 5,1,4,6,2,3,7
Folge 6 2,3,1 4,2,1,3 5,1,3,4,2 6,3,5,1,4,2 6,5,1,7,3,4,2


Mit den erzeugten Buchstabenfolgen wird eine Intervallsuche gestartet. In gleich grossen Textabschnitten des Buches wird die Anzahl der Startpunkte von Intervallen ermittelt und für das untersuchte Wort als rote Kurve dargestellt. Aus der Anzahl der gefundenen Intervalle der Folgen 2-6 wird das arithmetische Mittel gebildet und als schwarze Kurve überlagert.

Nachbarschaft

Die Nachbarschaft zwischen zwei Intervallworten im Text eines Buches wird in Anlehnung an die Arbeit von Witztum, Rips und Rosenberg ermittelt. Zur Bestimmung der Nachbarschaft zwischen zwei oder mehreren Intervallworten wird für jedes Intervallwort eine Intervallsuche durchgeführt. Aus dieser Suche werden max 25 der kleinsten Intervallweiten für die weitere Berechnung ausgewählt. Zu den ausgewählten Intervallen der vorgegebenen Worte wird der Maximalbereich ermittelt. Im nächsten Schritt wird der lineare Abstand \( WA \) der Worte zueinader in der Textkette festgestellt.

\( WA_{n,m}=\vert p_{n}-p_{m}\vert \)

\( p \) ist die Startposition des Intervalls in der Textkette.

\( 1...n \) das gefundene Intervall des Ausgangswortes.

\( 1...m \) das gefundene Intervall des Vergleichwortes.

Jedes ausgewählte Intervall eines Wortes wird mit allen ausgewählten Intervallen der anderen Worte bearbeitet. Bei mehr als 2 vorgegebenen Worten wird für \( WA_{n,m} \) die Summe der Abstände zu allen Worten ermittelt. Aus diesen Abstandsberechnungen sind die 20 kleinsten \( WA \) für die weitere Bearbeitung ausgwählt und werden als Wortgruppe bezeichnet. Im folgenden erfolgt die Ermittlung des Abstandes der Worte in einem Zeilenweise angeordneten Textfeld. Dazu wird der gesammte Text in Zeilen einer definierten Zeilenbreite zerlegt. Jeder Buchstabe im Textfeld hat somit eine Zeilen und Spaltenkoordinate die durch die Zeilenbreite bestimmt ist. \( GE \) als geometrische Entfernung zwischen zwei Buchstaben ergibt sich dann mit

\( GE=\sqrt{dz^{2}+ds^{2}} \)

\( dz \) ist der Betrag der Distanz der Zeilen und \( ds \) der Spalten der Buchstaben.

Das Entfernungsmass \( EM \) zwischen den Worten bei einer Zeilenbreite \( z \) bildet sich mit

\( EM_{z}=GE_{in}+GE_{im}+GE_{n,m} \)

\( GE_{in} \) bzw \( GE_{im} \) ist der geometrische Abstand zwischen dem ersten und zweiten Buchstaben des Intervalls \( n \) bzw \( m \)

\( GE_{n,m} \) ist der kleinste Abstand zwischen beiden Intervallen wenn man die \( GE \) der Start und Endpositionen der Interwallworte gegeneinander vergleicht. Weiterhin werden mehrere Zeilenbreiten \( z \) für eine Wortgruppe untersucht. Die Zeilenbreite ergibt sich aus der Intervallweite der beteiligten Intervalle oder ein mehrfaches bzw ein ganzzahliger Teil davon. Die Zeilenbreite welche das kleinste Entfernungsmass \( EM \) ergibt wird dieser Gruppe zugeordnet. Der Maximalbereich \( MB_{n,m} \) im Textfeld für diese Gruppe wird aus den Maximalbereichen der beteiligten Intervalle in Prozent ermittelt und in den Listen ausgewiesen. Der in der Liste 'nbr1' dargestellte Wert der Kompaktheit \( KG_{n,m} \) ergibt sich aus

\( KG_{n,m}=\frac{1}{EM} \)

Über dieses Dokument ...

This document was generated using the LaTeX2HTML translator Version 99.1 release (March 30, 1999)

Copyright © 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999, Ross Moore, Mathematics Department, Macquarie University, Sydney.

The translation was initiated by Hans-Jürgen on 2000-07-18


heinz@bitana.de

Weiter Zurück Inhaltsverzeichnis