Tags : Analyse de texte, numérisation, intelligence artificielle
Autor/in : Tony
Pour ce texte, vous disposez d'environ 7 minutes
Réponses à la complexité de l'orthographe
Goethe et Schiller. Bien que je n'aille pas trop loin dans un débat littéraire sur la qualité de ces auteurs, j'ai constaté, en discutant avec des lecteurs et des personnes intéressées par la littérature, qu'il y a souvent une certaine préférence pour l'un d'entre eux. Le tout est souvent combiné à une tendance tout aussi légère à l'injustice, qui fait que l'autre est toujours meilleur. Si l'on n'est pas convaincu par ce moment critique, on peut s'attendre à une discussion approfondie sur les structures métriques dans les œuvres élégantes. Personne ne peut le faire. Afin d'obtenir un effet de surprise, voici quelques arguments à court terme :
"Ahh, Die Metamorphose der Pflanzen... Oh ... toll ... Sex unter Pflanzen."
"Schiller est aussi un auteur, qui a su mettre en valeur un thème dans le contexte d'une plus grande échelle.
"Wo jetzt genau in Faust I das Drama aufhört und die Altherrenphantasie anfängt, ist ja wohl eine Gretchenfrage". (dans Anlehnung an Vidéo de Jan Böhmermanns)
"Kabale und Liebe ja als Aktualisierung eines Romeo und Juliasujets betrachten... Halt nur in schlecht und bürgerlich."
Si l'on considère l'ensemble un peu moins polémique, on constate que les deux auteurs (outre leur importance pour le conflit et la littérature weimarienne) ont eu une influence considérable jusqu'à la modernité et la postmodernité. Les places, les rues, les écoles, les universités, etc. sont, par exemple, inspirées de Goethe ou de Schiller.
|
...straße |
...platz |
...parc |
...allee |
...gasse |
...anneau |
Schiller... |
2232 |
106 |
7 |
9 |
8 |
13 |
Goethe... |
2134 |
74 |
6 |
18 |
0 |
31 |
Les deux auteurs sont présents dans les établissements d'enseignement supérieur des Länder. Marcel Reich-Ranickis les a fait connaître avec divers travaux dans son domaine. Dans les sondages sur les livres, 13 % à 15 % des clients affirment que l'un d'entre eux est un livre unique.
La question qui se pose est de savoir si, dans le cadre d'une discussion sur la littérature et la science, il y a une différence linguistique importante entre le texte et la langue : Y a-t-il au sein du texte une grande différence linguistique ?

Savoir où se trouve le point h
Un aspect, qui doit être examiné ici, est la taille du Wortschatz et, par conséquent, la diversité de la langue et la structure lexicale de l'auteur. Ce qui caractérise un Wortschatz, c'est qu'il est plus facile de l'interpréter que de l'interpréter. En outre, il faut tenir compte du fait que le Wortschatz provient de l'ensemble des termes utilisés par une personne, qu'il s'agisse d'un produit ou d'un service. La manière dont ce concept, évalué qualitativement, est structuré, est également présentée dans un autre tableau. Par exemple, si de nombreux mots-clés, mots-clés libres, alizismes, régionalismes, mots d'argot ou autres mots-clés sont utilisés. Übrigens ist das ein Grund, warum der Rapper Haftbefehl im Wortschatzranking knapp hinter Goethe liegt: Il a un poids très élevé dans les textes en d'autres langues qui, dans le cadre de l'interprétation d'un texte, ne peuvent pas être interprétés de la même manière. (Hier erklärt Haftbefehl auch nochmal verschiedene Lehnwörter.)
Et c'est là que l'on voit déjà les premières difficultés, si l'on veut savoir méthodiquement comment le Wortschatz d'une personne est structuré et comment on peut, par exemple, optimiser la taille du Wortschatz. Toutefois, le nombre de mots (jetons) n'augmente pas. De plus, le nombre de types n'est qu'un facteur marginal. Hierzu ein Beispiel aus meiner letzten Konversation :

Lorsque l'on parle ici de types et de jetons, c'est comme cela que l'on voit les choses :
Megan | Tony | |
Les types (Lemmata bzw. unterschiedliche Wörter) |
3 (fermer, fermer, flipper) | 12 (hey, du, haben, morgen, Lust, auf, schwimmen, im, See, sollen, gut, Wetter, sein) |
Jetons (toutes les formes) |
3 (fermer, fermer, flipper) | 15 (hey, du, hast, du, morgen, Lust, auf, Schwimmen, im See, morgen, soll, gutes, Wetter, werden) |
Le résultat était que j'avais un Wortschatz de 12 ou 15, ma partenaire de chat 3... Il est très difficile de savoir si, grâce à ces textes, mon Wortschatz est 4x plus grand. Il s'agit donc d'un autre problème : Il est vrai que les personnes qui ne peuvent pas se déplacer rapidement (ou qui ont besoin d'une grande quantité de matériel textuel) peuvent également obtenir des messages de meilleure qualité. L'une des possibilités d'abandonner l'ensemble est donc de renforcer la valeur lexicale. L'idée d'aujourd'hui est de comprendre à quel point un texte est complexe. L'idée de départ est de voir à quel point le contenu d'un message est complexe. Rapport Type-Token (TTR). Ce ratio montre comment de nombreuses formes de mots sont utilisées pour désigner des mots. L'idée d'aujourd'hui est très simple : Il faut savoir qu'un vocabulaire complexe indique que l'on peut utiliser des mots différents : un texte avec une valeur de 1 indique que le mot utilisé n'a pas d'importance. Si cette valeur est plus faible, les formes de mots (jetons) d'un même groupe de mots (type) seront utilisées plus tard.
Dans le premier cas, c'est ce qu'il faut faire :
Megan a une diversité lexicale de 1 (3 Types / 3 Tokens), ich hingegen de 0,87 (13 Types / 15 Tokens).
Mais il y a aussi le problème suivant : les mots les plus courants dans les langues naturelles ne sont pas toujours faciles à utiliser, notamment les pronoms ou les expressions comme "et", "dans", "dans", "derrière", "ou"... (y compris à cause des synonymes manquants).
C'est ainsi qu'ont été élaborées, depuis le début de l'année, d'autres méthodes, qui permettent également d'améliorer la qualité lexicale des textes. Il ne s'agit là que de quelques exemples : MTLD (mesure de la diversité lexicale textuelle), Guiraud's Root TTR, Herdan's C, Mean Segmental Type-Token Ratio, h-Point und weitere... Letzterer gibt übrigens den geometrischen Punkt an, ab welchem ein Text von Synsemantika (oder Funktionswörter) à des points d'ancrage autosémantiques (Inhaltswörter), et est donc pertinent pour l'analyse de nombreux indicateurs en linguistique quantitative.
Korpusgrundlage
Mais il ne faut pas oublier Goethe et Schiller : ces deux auteurs ne sont pas des écrivains à proprement parler. Comme ils ont écrit beaucoup de choses, voici un aperçu de ce que l'on peut trouver dans l'analyse de ces textes :
Goethe | Schiller |
Dramen La Laune des Verliebten Les Mitschuldigen Götz von Berlichingen mit der eisernen Hand (Götz de Berlichingen avec la main éternelle) Prométhée Satyros Götter, Helden et Wieland Un concours de manoeuvre du Pater Brey La fête de l'année pour les chasseurs de primes Erwin et Elmire Claudine von Villa Bella Faust [in ursprünglicher Gestalt] Clavigo Hanswursts Hochzeit Stella Die Geschwister Proserpina Le triomphe de l'esprit d'entreprise Egmont Iphigénie à Tauris Torquato Tasso Le grand arbre Der Bürgergeneral Les bénéficiaires Mahomet le Prophète La fille naturelle Faust : Der Tragödie erster Teil Pandora Des Epimenides Erwachen Faust : Der Tragödie zweiter Teil
Romane L'histoire du jeune Werther Wilhelm Meisters theatralische Sendung (L'envoi théâtral de Wilhelm Meisters) Wilhelm Meisters Lehrjahre Les conflits d'intérêts Wilhelm Meisters Wanderjahre
Erzählungen Unterhaltungen deutscher Ausgewanderten Briefe aus der Schweiz Novellen
Versepen Der ewige Jude Reineke Fuchs Hermann et Dorothea
Lyrik Gedichte (Ausgabe letzter Hand) Gedichte. Nachlese Xenien et Votivtafeln West-östlicher Divan
Sonstige Aufzeichnungen und Aphorismen (en anglais) Études sur l'esthétique Études sur la science de la nature
|
Dramen Les Räuber L'arrivée de Fiesco à Gênes Kabale und Liebe Don Karlos, Infant von Spanien Wallenstein Maria Stuart La Jungfrau d'Orléans Die Braut von Messina oder die feindlichen Brüder Wilhelm Tell L'huldigung des Künste Démétrius Der versöhnte Menschenfeind - Fragment Semele
Erzählungen Der Verbrecher aus verlorener Ehre (L'auteur d'une erreur dans l'âme) Spiel des Schicksals Une grande partie de la nouvelle histoire de l'humanité Histoires du vieux Pitaval Merkwürdiges Beispiel einer weiblichen Rache Der Geisterseher Der Spaziergang unter den Linden
Textes philosophiques Gedanken über den Gebrauch des Gemeinen und Niedrigen in der Kunst (Réflexions sur l'utilisation des formes et des couleurs dans l'art) Sur Anmuth et Würde Sur la pathétique À propos de l'Erhabene Sur les fondements de la lutte contre la corruption dans les situations tragiques Sur le rôle moral des institutions esthétiques Sur l'association de la nature thiéraire de l'homme et de la nature géante de l'homme Sur l'Erziehung ästhetische des Menschen (l'éducation esthétique des hommes) Sur les obstacles insurmontables à l'obtention de belles formes Des réflexions approfondies sur des aspects esthétiques variés Briefe philosophiques
Lyrik Gedichte : Gedichte Xenien Rätsel aus Turandot
Sonstige L'anniversaire de la "Rheinischen Thalia" (Thalie rhénane) A propos de Bürgers Gedichte Über Egmont, Trauerspiel von Goethe À propos des jeux de Matthissons Qu'est-ce qui peut faire qu'une belle pierre à l'état brut puisse être utilisée ? Les chevaux Sur l'écriture épique et dramatique Sur l'écriture naïve et sentimentale Brief eines reisenden Dänen Sur l'art tragique Dom Karlos Briefe über Don Carlos Repertorium des Mannheimer Nationaltheaters Guerre des théâtres en Wallonie Les conditions de la dramaturgie Die Schaubühne als eine moralische Anstalt betrachtet (La Schaubühne en tant qu'institution morale) Kallias ou sur la Schönheit Histoire des trois guerres mondiales Histoire de l'abandon de la Niederlande vereinigten par le gouvernement espagnol Qu'est-ce que cela signifie et à quelle fin l'homme étudie-t-il l'histoire universelle ? La loi de Lykurgus et de Solon Denkwürdigkeiten aus dem Leben des Marschalls von Vieilleville Geschichte der Unruhen in Frankreich, welche der Regierung Heinrichs IV. vorangingen (Histoire des troubles en France, que le gouvernement de Heinrichs IV. a corrigés) Herzog von Alba à l'occasion d'un pèlerinage sur la colline de Rudolstadt, en 1547 Über Völkerwanderung, Kreuzzüge und Mittelalter Übersicht des Zustands von Europa zur Zeit des ersten Kreuzzugs (en anglais) L'histoire universelle des droits de l'homme dans les pays les plus pauvres L'histoire de la première société de gestion des déchets après la création de l'unité de gestion des déchets mosaïques L'envoi de Moïse Des Grafen Lamoral von Egmont Leben und Tod Turandot, princesse de Chine Le neveu comme oncle Der Parasit Iphigénie à Aulis Macbeth Phaedra (Phèdre) À l'attention des producteurs de propylène Sur le catalogue de jardinage de l'année 1795 Vorrede zu dem ersten Theile der merkwürdigsten Rechtsfälle nach Pitaval Vorrede zu der Geschichte des Maltheserordens nach Vertot von M. N. bearbeitet
|
GOETHE | SCHILLER | ||||||||||||||||||||||||||||||||||||||||
Gesamtlemmata : | 61862 | 48828 | |||||||||||||||||||||||||||||||||||||||
Les mots clés sont : "le nom", "l'adresse", "le numéro de téléphone", "le numéro de téléphone" : | 1557576 | 1221497 | |||||||||||||||||||||||||||||||||||||||
La reconnaissance des fonctions de l'utilisateur par l'utilisateur final : | 0.5631 | 0.5629 | |||||||||||||||||||||||||||||||||||||||
TTR : | 0.0397 | 0.0399 | |||||||||||||||||||||||||||||||||||||||
MLTD : | 70.3982 | 69.0314 | |||||||||||||||||||||||||||||||||||||||
SSTR : | 0.6827 | 0.6774 | |||||||||||||||||||||||||||||||||||||||
Vocabulaire-Richesse : | 0.4058 |
0.4379
|
|||||||||||||||||||||||||||||||||||||||
VOCD : | 0.8511 | 0.7830 | |||||||||||||||||||||||||||||||||||||||
Durchschnittlicher Verbabstand : | 7.0491 | 7.6066 | |||||||||||||||||||||||||||||||||||||||
Durchschnittliche Kommata/Satz : | 1,5459 | 1,3076 | |||||||||||||||||||||||||||||||||||||||
Satzlänge Durchschnittliche : |
15,1127 Wörter
|
14,2750 Wörter
|
|||||||||||||||||||||||||||||||||||||||
h-Punkt : | 408.0 |
364.5
|
Qu'est-ce que cela signifie ?
Pour que Goethe comprenne, il faut que l'homme dispose d'environ 62 000 lemmes de mots, alors que Schiller n'en a que 49 000. Cela peut être très difficile à comprendre. Il faut cependant savoir que si le Wortschatz actif dans le contexte de 12 000 mots et le Wortschatz passif (mots vers lesquels l'homme se tourne, sans qu'ils soient actifs) se situent à 100 000, le Wortschatz actif (plus que le Wortschatz individuel) est plus élevé que le Wortschatz passif (plus que le Wortschatz individuel), ce qui n'est pas le cas. hier, à l'expression orale en général hier). Daraus folgt jedoch nicht zwangsläufig, dass Goethe auch den größeren Wortschatz hat(te), gleichwohl sein Werk auch etwas umfänglicher ist. En effet, l'homme s'intéresse à d'autres outils de mesure de la diversité des langues(TTR, MLTSD, SSTR, VOCD et richesse du vocabulaire), et il se rend compte qu'il n'y a pas d'écart entre les deux auteurs. Avec un penchant minimal pour Goethe. En revanche, les différences entre les deux auteurs sont bien perceptibles dans l'écriture (position de l'auteur, rythme de l'écriture, composition de l'écriture).
Non, en tout cas, je sais maintenant ce que je peux attendre de la dernière discussion. Il s'agit de savoir si, du moins d'un point de vue linguistique, les deux parties ont affaire à un message extrêmement vaste et complexe, qui n'a rien à voir avec la structure de l'individu. C'est pourquoi, pour la prochaine discussion, je ne vois rien d'autre à faire que d'aborder, au moment opportun, le sujet sous un angle différent. Baden am See beispielsweise und Messmethoden zur Bestimmung von Vokabelreichtum.
Weiterführende Literatur :
Type-Token-Relation Verfügbar unter : http://www.glottopedia.org/ index.php/Type-Token-Relation [15.06.2020]
Jarvis, S. (2013), Capturing the Diversity in Lexical Diversity. Language Learning, 63 : 87-106. doi:10.1111/j.1467-9922.2012.00739.x
Mccarthy, P. & Jarvis, S. (2010), MTLD, vocd-D, and HD-D : A validation study of sophisticated approaches to lexical diversity assessment. Behavior research methods. 42. 381-92. doi :10.3758/BRM.42.2.381.