MYE012/ΠΛΕ059 – Εξόρυξη Δεδομένων

Εαρινό Εξάμηνο, 2017

 

Αρχική

Υλικό

Διαφάνειες

Ασκήσεις

 

 



Ασκήσεις

Πολιτική Free Pass: Για να αντιμετωπίσουμε επικαλύψεις μεταξύ προθεσμιών, ο καθένας σας έχει 4 free passes για την παράδοση των ασκήσεων. Δηλαδή έχετε 4 μέρες παράτασης τις οποίες μπορείτε να χρησιμοποιήσετε για παράταση της προθεσμίας σε περίπτωση προβλήματος. Ένα free pass θεωρείται ότι χρησιμοποιήθηκε μόλις περάσει η προθεσμία παράδοσης (εφόσον το θέλετε). Αν περάσουν πάνω από 24 ώρες τότε χρησιμοποιείτε δεύτερο free pass. Αν σας έχουν τελειώσει τα free passes, (ή αν δεν θέλετε να χρησιμοποιήσετε το free pass) τότε ισχύει η πολιτική για τις καθυστερημένες ασκήσεις.

Πολιτική για καθυστερημένες ασκήσεις: Η πρώτη μέρα καθυστέρησης αφαιρεί 10% του μέγιστου βαθμού, η δεύτερη μέρα 20%, η τρίτη 40%, και η τέταρτη 80%. Στην πέμπτη μέρα καθυστέρησης χάνεται το 100% της άσκησης.

Turn-in: Κάνετε turn-in, χρησιμοποιώντας την εντολή: turnin assignmentΧ@ple059 <τα αρχεία σας>. Δώσετε επεξηγηματικά ονόματα στα αρχεία σας, και αναγράφετε το όνομα και το ΑΜ σας στο αρχείο. Η τελευταία παράδοση μετράει για κάθε άσκηση, και αν είναι εκπρόθεσμη εφαρμόζεται ο κανόνας για τις καθυστερημένες ασκήσεις.

Αναφορές: Σε διάφορες ασκήσεις θα σας ζητηθεί να γράψετε μία αναφορά για τον κώδικα σας, ή για τα αποτελέσματα σας. Για τον κώδικα θα πρέπει να γράψετε περιληπτικά πως είναι δομημένος και να δώσετε οδηγίες για το πώς μπορεί κάποιος να τον τρέξει. Για τα αποτελέσματα, θα πρέπει να κοιτάξετε τι βρίσκει ο κώδικας σας, και να γράψετε τις παρατηρήσεις σας: Πόσο καλά τα καταφέρατε ως προς αυτό που θέλατε να κάνετε? Βρήκατε κάτι ενδιαφέρον? Υπάρχουν περιπτώσεις στις οποίες πρέπει να επιστήσετε την προσοχή του αναγνώστη? Η αναφορά είναι ένα πολύ σημαντικό κομμάτι της εργασίας. Η εργασία σας βαθμολογείται και από την αναφορά.

Άσκηση Σεπτεμβρίου

Μπορείτε να κατεβάσετε την Άσκηση Σεπτεμβρίου εδώ. Η προθεσμία για την παράδοση είναι 24 Σεπτεμβρίου στο τέλος της μέρας. Κάνετε turn-in τον κώδικα στο φάκελο assignment-sept, και παραδώστε την αναφορά είτε ηλεκτρονικά, είτε σε χαρτί.  Η προφορική εξέταση θα γίνει την εβδομάδα που ακολουθεί. Στείλτε μου email με την μέρα και ώρα που σας βολεύει.

 

Άσκηση 4

Μπορείτε να κατεβάσετε την Άσκηση 4 εδώ. Η προθεσμία για την παράδοση είναι 21 Ιουνίου στο τέλος της μέρας. Κάνετε turn-in τον κώδικα στο φάκελο assignment4, και παραδώστε την αναφορά είτε ηλεκτρονικά, είτε σε χαρτί.  Για την δεύτερη ερώτηση θα πρέπει να καταθέσετε μια λύση στο Kaggle στον διαγωνισμό του μαθήματος, ο οποίος έχει την προθεσμία στις 25 Ιουνίου (εδώ είναι ο σύνδεσμος για τον διαγωνισμό). Δημιουργήσετε ένα λογαριασμό στο Kaggle με το λογαριασμό του πανεπιστήμιου. Ο σύνδεσμος μπορεί να μην είναι άμεσα προσβάσιμος μέχρι να εγκριθεί από τους moderators. Η προφορική εξέταση θα γίνει την εβδομάδα που ακολουθεί. Αν κάποιος θέλει να εξεταστεί νωρίτερα μπορεί να επικοινωνήσει μαζί μου.

Άσκηση 3

Μπορείτε να κατεβάσετε την Άσκηση 3 εδώ. Η προθεσμία για την παράδοση είναι 21 Μαΐου στο τέλος της μέρας. Κάνετε turn-in τον κώδικα στο φάκελο assignment3, και παραδώστε την αναφορά είτε ηλεκτρονικά, είτε σε χαρτί. 

Υλικό για την άσκηση: Το αρχείο clinton_trump_tweets.txt, και clinton_trump_user_classes.txt

Άσκηση 2

Μπορείτε να κατεβάσετε την Άσκηση 2 εδώ. Η προθεσμία για την παράδοση είναι 2 Μαΐου πριν το μάθημα. Κάνετε turn-in τον κώδικα στο φάκελο assignment2, και παραδώστε την αναφορά είτε ηλεκτρονικά, είτε σε χαρτί. 

Υλικό για την άσκηση: Το αρχείο stringHash.py

Άσκηση 1

Μπορείτε να κατεβάσετε την Άσκηση 1 εδώ. Η προθεσμία για την παράδοση είναι 31 Μαρτίου στις 11:59 μ.μ. Κάνετε turn-in τον κώδικα στο φάκελο assignment1, και παραδώστε τις υπόλοιπες ερωτήσεις είτε ηλεκτρονικά, είτε σε χαρτί. Την εβδομάδα του Απριλίου 3, θα γίνει προφορική εξέταση της άσκησης.

Υλικό για την άσκηση:

·       Το αρχείο data.csv για την Ερώτηση 2.

·       Το αρχείο  twitter_dataset.txt για την Ερώτηση 3.