kristallpirat (@kristallpirat) 's Twitter Profile
kristallpirat

@kristallpirat

raumstationsavatar; member of @cbase; #SchrifttumsLinguistik #ComputerLinguistik #cnowledgeEngineering #KI #AI #TypeDB #NLProc #billsmafia and more

ID: 1107094412654493697

calendar_today17-03-2019 01:40:51

2,2K Tweet

182 Takipçi

340 Takip Edilen

kristallpirat (@kristallpirat) 's Twitter Profile Photo

Sagte ich "ein" breitenloser Bindehemmer (dt. für ZWNJ)? Ich finde insgesamt 22 (allein in den Gründen der Entscheidungen). Irgendwo in einer weiteren Entscheidung versteckt sich auch mindestens ein '\u200b' (ein breitenloses Leerzeichen). #SchrifttumsLinguistik

Sagte ich "ein" breitenloser Bindehemmer (dt. für ZWNJ)?  

Ich finde insgesamt 22 (allein in den Gründen der Entscheidungen).  

Irgendwo in einer weiteren Entscheidung versteckt sich auch mindestens ein '\u200b' (ein breitenloses Leerzeichen).  

#SchrifttumsLinguistik
kristallpirat (@kristallpirat) 's Twitter Profile Photo

Auf Zeitungstext trainierte ML-Modelle haben immer wieder Probleme mit juristischen Texten. Außerdem fehlt mir bei Universal Deps eine einf. Phrasenbildung (li) In meinem regelbasierten Modell sind Phrasen von Anfang mitgedacht und vereinfachen einiges (re) #SchrifttumsLinguistik

Auf Zeitungstext trainierte ML-Modelle haben immer wieder Probleme mit juristischen Texten. Außerdem fehlt mir bei Universal Deps eine einf. Phrasenbildung (li)
In meinem regelbasierten Modell sind Phrasen von Anfang mitgedacht und vereinfachen einiges (re)
#SchrifttumsLinguistik
kristallpirat (@kristallpirat) 's Twitter Profile Photo

I finally started to implement Koreferenz. Maybe the last bigger missing piece before I start with building GNN with (legal) german. The whole analysis is rule and lexicon based and no ML. #SchrifttumsLinguistik

I finally started to implement Koreferenz.

Maybe the last bigger missing piece before I start with building GNN with (legal) german.

The whole analysis is rule and lexicon based and no ML.

#SchrifttumsLinguistik
kristallpirat (@kristallpirat) 's Twitter Profile Photo

Dieser Satz ist schwer zu parsen. Nun hab ich eine Lösung, die auch hält, wenn es subtile Unterschiede gibt ("," statt "-" & verschiedene Sorten "). Koref zickt noch etwas. Was mir aber auch wieder bewußt wird: ich brauche Normalisierung von Quellen. #SchrifttumsLinguistik

Dieser Satz ist schwer zu parsen. Nun hab ich eine Lösung, die auch hält, wenn es subtile Unterschiede gibt ("," statt "-" & verschiedene Sorten "). Koref zickt noch etwas.

Was mir aber auch wieder bewußt wird: ich brauche Normalisierung von Quellen.

#SchrifttumsLinguistik
kristallpirat (@kristallpirat) 's Twitter Profile Photo

Es gibt Wörter, die wenn sie Kompositatöchter sind ein -e verlieren: Sache -> Sachbearbeiter (*Sachebearbeiter) Urkunde ist hier nochmal ein spezieller Spezialfall, denn eine -s- Fuge schleicht sich ein: Urkunde -> Urkundsbeamte #Morphologie #SchrifttumsLinguistik