Business Analyse – Viel Text schnell analysiert am Beispiel 231/2013/EU
Heute geht es mal wieder um die alltägliche Praxis. Ich beschäftige mich hier im Blog intensiv mit dem KAGB und seinem Umfeld sowie den Alternativen Assets. Anfänglich ganz naiv habe ich mir versucht einen Überblick über die Inhalte des KAGB zu beschaffen, um die gewonnen Erfahrungen in die tägliche Beratungspraxis einfließen zu lassen. Wie ich heute weiß, für eine einzelne Person ein kaum machbares Unterfangen.
Was macht man aber wenn man sich schnell in solche Mammutwerke einarbeiten muss, weil beispielsweise eine dringende Anfrage eines Mandanten auf dem Schreibtisch liegt.
Nun, um das Lesen kommt man nicht herum, aber neben der ersten groben Sichtung der Gliederung, welche wie mehrfach in den Beiträgen erwähnt schon einen wesentlich besseren Überblick gibt, bin ich dazu übergegangen, zusätzlich ein Textanalyse Tool einzusetzen.
Das einfachste Tool, welches ich hierzu ausfindig machen konnte ist: TextStat 3.0 von Lionel P. Allorge, welches sich einfach und schnell einsetzen lässt. Die Website wirkt nicht sehr vertraulich, aber in Geschmäcker sind halt verschieden.
In dem Tool kann man typische Füllwörter wie z.B. der, die, bei, beim, also etc. vorab ausklammern. Da das Tool in Englisch oder Französisch erhältlich ist, werden leider die Umlaute ä, ö usw, in a und o gewandelt. Damit kann und muss ich leben.
Das Tool habe ich auf die EU-Verordnung 231/2013 angewandt. Ich erhalte eine ganze Menge von statistischen Daten, über Satzlängen, Absätze etc. Diese lösche ich direkt weg. Mich interessieren nur die Begriffe. Diese kopiere ich in Excel und erhalte eine zweispaltige Liste mit Begriffen und Häufigkeiten. Diese sortiere ich absteigend und habe so am Anfang die meist genutzten Wörter. Nach der Bereinigung der Füllwörter ergibt sich folgende Aufstellung.
1. AIFM 563
2. AIF 497
3. Richtlinie 189
4. EU 161
5. Verfahren 118
6. Vermogenswerte 115
7. Verwahrstelle 107
8. verwalteten 104
9. Informationen 87
10. Aufgaben 71
———————————-
11. Art 70
12. Anleger 69
13. Risikomanagement 69
14. Europaischen 68
15 .Grundsatze 68
16. Bewertung 63
17. zustandigen 62
18. Berechnung 58
19. Union 56
20. angemessene 55
———————————-
21. Funktion 54
22. Risiken 54
23. Anforderungen 51
24. Amtsblatt 49
25. Behorden 49
26. Tatigkeiten 49
27. Ubertragung 49
28. mindestens 48
29. Einklang 46
30. Person 46
———————————-
31. Risiko 46
32. Anlegern 45
Somit habe ich einen ersten sehr guten Überblick, um die wichtigsten Inhalte. Natürlich könnte ich noch mehr Zeit investieren, um das ganze zu perfektionieren. In diesem Fall würde dann aus Anleger (69) und Anlegern (45) der Begriff Anleger (114), welcher im Ranking auf Platz 7 springen würde. Ehrlich gesagt glaube ich aber nicht, dass dies wirklich notwendig ist.
Zusammen mit der Gliederungsansicht, welche ich mir angewohnt habe für die Verordnungen und Gesetze in einer kaskadierenden Excel Liste oder als Mindmap anzulegen, kann ich im Groben erahnen, worum es im Gesetz geht und wo die Schwerpunkte liegen.
In der konkreten Umsetzungsphase verfeinere ich die Analyse regelmäßig zur Identifizierung von möglichen Aufgaben und Eigenschaften, welches es gilt, aus dem Fachexperten mühsam heraus zu kitzeln.
Bis zum beginn dieses Absatzes und ohne Titel hat der Beitrag folgendes statistisches Ergebnis:
Anzahl der
- Absätze: 54
- Wörter: 506
- Sätze: 97
- Druckbaren Zeichen (inklusive Leerzeichen): 3275
- Leerzeichen: 461
- Tabulatoren: 0
- Umbrüche: 53
- Wörter je Satz: 5.22
- Silben je Wort: 1.75
- Flesch index: 53.91
Interessant ist der Flesch Index, welcher auf einer Skala von 0 bis 100 angesiedelt wird. Suche auf Wikipedia nach „Lesbarkeitsindex“ und Du siehst, dass Dich dieser Beitrag rein schreib technisch vor keine intellektuelle Herausforderung stellen sollte.
Dies war es schon mit meiner Anregung aus der täglichen Analysepraxis. Bei kürzeren Texten macht die Methode wenig Sinn.
Ein weiteres Tool, welches ich zur Textanalyse einsetzte ist: AntConc, von Laurence Anthony. Hier werden unter anderem Suchwörter im Kontext dargestellt.