Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15941
Τίτλος: | Διαχωρισμός Και Κατηγοριοποίηση Καταχωρήσεων Ιστολογίων |
Συγγραφείς: | Αναστασιαδης Αντωνιος Σελλής Τιμολέων |
Λέξεις κλειδιά: | blogs data mining classification |
Ημερομηνία έκδοσης: | 14-Μαρ-2011 |
Περίληψη: | The scope of this thesis was the development of methods for the automaticextraction of the posts found in blog pages on the internet, and to classifythem as to the opinion they represent regarding a specific topic. Thosemethods take advantage of the syntactic information of the HTML code ofthe blog web pages, as well as their feeds and the date strings they contain.We also use an algorithm with Support Vector Machines to classify theextracted posts into two collections that represent the positive and negativeopinions respectively.Moreover, we developed a standaloneJava application, that given acorpus of blogs, it extracts their posts in an automatic and efficient way.We also developed tools that format the extracted data in feature vectorrepresentation format that is ready for classification, as well as classify it.This work can be used as a basis for a more complex system thatfinds, separates and classifies blogs using more advanced methods suchas lingual analysis and machine learning to extract and classify their posts. |
URI: | http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15941 |
Εμφανίζεται στις συλλογές: | Διπλωματικές Εργασίες - Theses |
Αρχεία σε αυτό το τεκμήριο:
Αρχείο | Μέγεθος | Μορφότυπος | |
---|---|---|---|
DT2011-0040.pdf | 808.42 kB | Adobe PDF | Εμφάνιση/Άνοιγμα |
Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.