Zur Kurzanzeige

dc.date.accessioned2020-08-19T16:45:25Z
dc.date.available2020-08-19T16:45:25Z
dc.date.issued2020
dc.identifierdoi:10.17170/kobra-202008181593
dc.identifier.urihttp://hdl.handle.net/123456789/11707
dc.language.isoengeng
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectData Miningeng
dc.subjectMachine Learningeng
dc.subjectRecommender Systemseng
dc.subjectOnomasticseng
dc.subjectPredictioneng
dc.subjectForecasteng
dc.subjectData Scienceeng
dc.subjectStatistical Analysiseng
dc.subject.ddc004
dc.titleAnalyzing Given Nameseng
dc.typeDissertation
dcterms.abstractComputer science has evolved so much that it influences almost every part of human live. A particularly personal part of human live is the selection of a given name for a newborn baby. The name discovery service Nameling is our way to help expectant parents with this decision. It is a web service that helps parents to find a given name for their newborn baby. We want to further improve the user experience of Nameling by personalizing its name results for the current user. We deem this important, because the selection of a given name itself is a very important and difficult one. In order to improve Nameling, we explore three promising areas that could benefit Nameling: Inferring the gender of the requested name to tailor the results to the need of the parents, using information about the popularity of names for the same purpose, and adding a name recommender to add more diversity to the returned name lists. The first area of this thesis explores the possibilities to infer the gender of a given name based on a set of characteristics like its number of vowels. The gender is obviously an important part in the selection of a given name of a newborn baby. Inferring the gender of a requested name on Nameling is useful as it can help understand the gender of interest the current user is looking for. Nameling can then boost the ranking of names from the inferred gender (e.g., ranking names from that gender higher). Therefore, we present an automatic gender inference method for the written word of a given name and show its utility by improving the gender inference of Twitter users. The second area explores the possibilities of popularity information. There is evidence that parents prefer names with a certain level of popularity. Further, there have been reports that parents use the names of their children to signal their own ideology—or more precisely, the ideological traits they associate with a given name. Both information can be used to personalize the user experience on Nameling by re-ranking the list of names based on the observed expectations. We test the usefulness of popularity information in two prediction experiments: The first predicts the future popularity of given names, while the second predicts the future popularity of Twitter users using the self-reported real name. The last area covers recommendation methods for given names. We present the results from the discovery challenge that we conducted in order to find a good recommendation algorithm for Nameling. We then take the submitted recommendations and try to find a good hybridization method that can further improve the quality of the submitted recommendations. The experiments in this thesis demonstrate the usefulness of each of our three areas. We compare our methods against contending methods that could be used to solve the presented issues otherwise. The key difference of our methods is that they draw from both computer science and onomastics, which gives them an advantage compared to the contending methods. Our findings can be used to improve the user experience of Nameling and to motivate further research on the edge between computer science and onomastics.eng
dcterms.abstractDie Informatik hat sich rasant weiterentwickelt, so sehr das sie auf nahezu jeden Bereich menschlichen Lebens Einfluss nimmt. Ein besonders persönlicher Bereich ist die Wahl eines Vornamens für das eigene Kind. Die Namenssuchmaschine Nameling ist unser Beitrag, um werdende Eltern bei dieser Entscheidung zu unterstützen. Nameling ist eine Internetseite, die Eltern bei der Namensfindung hilft indem sie ihnen Namensvorschläge macht. Wir wollen die User Experience von Nameling weiter verbessern, indem wir Nameling personalisieren. Wir glauben, dass das den Dienst deutlich attraktiver machen wird, da die Wahl eines Vornamens eine sehr schwerwiegende Entscheidung ist. Entsprechend erforschen wir drei vielversprechenden Themenbereiche: Die Geschlechtsbestimmung des gesuchten Namens um die Trefferliste an die Erwartungen der Eltern anzupassen, die Nutzung von Beliebtheitsinformationen aus gleichem Grund und der Einsatz eines Empfehlungssystemen, um den angezeigten Namenslisten vielfältiger zu gestallten. Der erste Teil dieser Dissertation beschäftigt sich mit Verfahren zur Geschlechtsbestimmung von Vornamen basierend auf einer Reihe von Merkmalen wie der Anzahl der Vokale. Das Geschlecht ist offensichtlich ein wesentlicher Faktor bei der Namenswahl. Die Bestimmung des Geschlechts eines gesuchten Namens auf Nameling ist sinnvoll, da sie dazu beitragen kann, das gewünschte Geschlecht des Interesses des jeweiligen Nutzers zu erfassen. Zu erkennen, nach welchem Geschlecht die Eltern suchen, ist hilfreich, um die angezeigten Namenslisten daraufhin zu optimieren (z.~B.: Indem Namen dieses Geschlechts höher platziert werden). Deshalb stellen wir eine automatische Geschlechtsbestimmungsmethode für Vornamen vor, die auf Basis der Buchstaben des Namens arbeitet. Wir zeigen ihren Mehrwert durch die Optimierung einer bestehenden Geschlechtsbestimmungsmethode für Twitter-Nutzer. Der zweite Teil dieser Dissertatoin widmet sich den Möglichkeiten von Beliebtheitsdaten. Es gibt Anhaltspunkte dafür, dass Eltern feste Vorstellungen über die Beliebtheit von Namen haben. Ferner gibt es Arbeiten die nahelegen, dass Eltern die Namen ihrer Kinder dazu nutzen, um ihre eigene Ideologie zu signalisieren---oder genauer gesagt, die ideologischen Züge, die sie in diesen Namen sehen. Beides kann dazu genutzt werden Nameling weiter zu personalisieren, durch eine Neusortierung der angezeigten Namensliste basierten auf den ermittelten Erwartungen der Eltern. Wir zeigen den Mehrwert diese Beliebtheitsdaten mittels zweiter Vorhersage-Experimente: Das Erste sagt die künftige Verbreitung von Vornamen voraus, während das Zweite mithilfe der angezeigten Namen die künftige Beliebtheit von Twitter-Nutzern vorhersagt. Der letzte Teil dieser Dissertation befasst sich mit Empfehlungsverfahren für Vornamen. Wir stellen die Ergebnisse der Discovery Challenge vor, die wir zur Findung eines Empfehlungsalgorithmus für Nameling durchgeführt haben. Wir nutzen die eingereichten Empfehlungen anschließend um eine Hybridisierungsmethode zu entwickelt, welche die resultierenden Namenslisten weiter verbessert. Die Experimente dieser Arbeit demonstrieren den Mehrwert eines jeden Teils. Wir haben alle Methoden mit Alternativen verglichen, die sonst zur Lösung der dargestellten Fragestellungen genutzt werden könnten. Das wesentliche Unterscheidungsmerkmal unserer Methoden ist, dass sie sowohl Erkenntnisse aus der Informatik als auch aus der Onomastik nutzen, was ihnen gegenüber den Alternativverfahren einen Vorteil verschafft. Unsere Ergebnisse können dazu genutzt werden, die User Experience von Nameling zu steigern und können weitere Forschungsarbeiten an der Schnittstelle von Informatik und Onomastik stimulieren.ger
dcterms.accessRightsopen access
dcterms.creatorMüller, Jürgen
dcterms.dateAccepted2020-03-05
dcterms.extentxxiv, 206 Seiten
dc.contributor.corporatenameKassel, Universität Kassel, Fachbereich Elektrotechnik / Informatikger
dc.contributor.refereeStumme, Gerd (Prof. Dr.)
dc.subject.swdData Miningger
dc.subject.swdMaschinelles Lernenger
dc.subject.swdEmpfehlungssystemger
dc.subject.swdNamengebungger
dc.subject.swdNamenkundeger
dc.subject.swdPrognoseger
dc.subject.swdData Scienceger
dc.subject.swdStatistische Analyseger
dc.title.subtitleExploring Potentials for a Personalized Name Discovery on Nameling.neteng
dc.type.versionpublishedVersion
kup.iskupfalse


Dateien zu dieser Ressource

Thumbnail
Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige

Attribution-NonCommercial-NoDerivatives 4.0 International
Solange nicht anders angezeigt, wird die Lizenz wie folgt beschrieben: Attribution-NonCommercial-NoDerivatives 4.0 International