Το Meltemi είναι το πρώτο Ελληνικό μεγάλο γλωσσικό μοντέλο (LLM), που εκπαιδεύτηκε από το Ινστιτούτο Επεξεργασίας Λόγου του Ερευνητικού Κέντρου Αθηνά. Το Meltemi είναι ένα δίγλωσσο μοντέλο. Ενώ διαθέτει υψηλή επάρκεια στα Αγγλικά, έχει επεκταθεί ώστε να κατανοεί και να παράγει άπταιστο κείμενο στην Νέα Ελληνική. Βασισμένο στο Mistral-7B μέσω συνεχούς προ εκπαίδευσης (continual pretraining), το Meltemi έχει εκπαιδευτεί σε ένα σώμα κειμένων (corpus) 28.5 δισεκατομμυρίων tokens, το οποίο περιλαμβάνει υψηλής ποιότητας Ελληνικά κείμενα.
