Το Corpus αποτελεί ένα τεράστιο σύνολο δεδομένων που περιέχει δεδομένα πλήρους κειμένου από δέκα μεγάλα σώματα αγγλικών -- iWeb, COCA, COHA, NOW, Coronavirus, GloWbE, TV Corpus, Movies Corpus, SOAP Corpus, Wikipedia -- καθώς και το Corpus del Español και το Corpus do Português. Τα δεδομένα χρησιμοποιούνται σε εκατοντάδες πανεπιστήμια σε όλο τον κόσμο, καθώς και σε ένα ευρύ φάσμα εταιρειών.
