Wednesday, May 24, 2017

A Rule of Thumb for Predicting the Gender of Italian Language Nouns


Background


Nouns in the Italian language have a gender, that is, a noun can be male or female, and in some cases, both. Specifically, Italian, like other Romance languages, has a grammatical gender where nouns must agree with other parts of the language, such as articles, pronouns, and adjectives. And therein lies the problem, you have to know the gender to make the correct agreements. And while there is a rule of thumb based on word ending to help you predict the gender, it's useful to be aware of the different classes of exceptions.

In modern English, except for a few cases (see Gender in English), nouns don't have a gender. Therefore, speakers and writers in English don't worry about a car being feminine as it is in Italian (la macchina) or the sun being masculine (il sole). Sure, we might refer to a car as a “she” or the sun as “he” if we want to, but it's done through pronouns, which is pretty easy. My yellow car and my yellow sun both use "my yellow". Using the same examples, in Italian there needs to be grammatical agreement, therefore la mia macchina gialla and il mio sole giallo, my yellow car and my yellow sun, respectively.

Rule of Thumb


A rule of thumb for Italian nouns is that singular nouns ending in 'o' are masculine while singular nouns ending in 'a' are feminine. Singular nouns ending in 'o' become plural (usually*) by changing the ending to 'i'. Singular nouns ending in 'a' become plural (usually*) by changing the ending to 'e'. Examples include il palazzo/i palazzi, l'amico/gli amici, la casa/le case, and la ragazza/le ragazze. So, in general, we just need to look at the ending to work out the gender.

* As you would expect, exception exist like tempio/tempi and giacca/giacche.

The majority of Italian nouns follow the rule of thumb above. But how many? It turns out you can get an estimate by turning to databases and archives of the Italian language. The prestigious Italian language institute Accademia della Crusca maintains a list of such resources. It's a daunting list, but with a little poking around it starts to make sense. For example, the most well-known list of words is the Lessico di frequenza dell'italiano parlato (Corpus LIP). The corpus includes 469 texts originating from transcriptions of spoken word that yield a corpus of approximately 490,000 words. The transcriptions were taken from speakers in four cities (Milan, Florence, Rome and Naples) and in numerous situations, such as face-to-face conversations or a lecture in school.

To use the Corpus LIP data, you can download the data to a CSV file, and import into a spreadsheet. Sort the table by frequency and filter for just nouns. You will find that for the top 500 nouns:


  • Following the rule of thumb:
    • 40% are nouns ending in 'o' that are masculine
    • 31% are nouns ending in 'a' that are feminine
  • Not following the rule of thumb:
    • 11% are nouns ending in 'e' that are masculine
    • 12% are nouns ending in 'e' that are feminine
    • 5% are nouns with other endings, e.g., ending with 'a' that are masculine, or nouns that can be either masculine or feminine

Based on this data, we can say that the rule of thumb for predicting the gender is good for about 70% of Italian nouns.

Next, let's take a look at the work of Scudit, Scuola d'Italiano Roma, which has created a curated list of 333 essential nouns that should absolutely be part of the vocabulary of a beginning Italian student. Scudit starts with the LIP corpus and then adds and removes words from the list to arrive at a vocabulary they feel is representative of what a beginning student should know. Though it's a different end goal than just looking at word frequency, it's interesting to see what their word list reveals about the applicability of the rule of thumb. Answer: the Scudit site states that about 70% are nouns ending in 'o' that are masculine or ending in 'a' that are feminine, comparable to what was calculated above.

Exception Lists


I started out my descent into madness modestly trying to maintain a list of Italian nouns that end in 'e' and are feminine in gender (e.g., la chiave). I did this as a learning exercise, but soon it expanded to tracking classes of nouns that deviated from the rule of thumb.

Why is it important to be familiar with Italian nouns that don't follow the norm? As mentioned above, to speak and write correctly, there needs to be agreement between nouns and related articles, pronouns, and adjectives. Doing so leads to better communication and requires less effort from listeners and readers. Many of the nouns that deviate from the rule of thumb appear surprisingly often in everyday conversation and writing. For example, an Italian will understand you just fine if you say (incorrectly) “love is beautiful” as “L'amore è bella” instead of (correctly) as “L'amore è bello”, but the correct form requires less effort by the listener. Think of how many times you've heard someone new to the English language swap “she” for “he” or vice-versa. You know what the intent is and probably the context, but you stop – even if for a fraction of a second – to parse the word and correct it in your mind. It's that kind of extra cognitive work you'd like to avoid in people listening to or reading your Italian.

Along with consulting these lists, it's worthwhile to find your favorite Italian grammar guide and read up on nouns. Or, at least consult the quick overview in Wikipedia, Italian Language, particularly the part on nouns. Also, try the Wikibooks page for Italian/Nouns.

How did I come up with these words?  I've encountered them in everyday life, be it in the grocery store or café, or talking or reading. Admittedly, a few of the words are a little obscure such as rupe (cliff) and isteresi (hysteresis), and are an indication of what catches my eye.

Examples of nouns that are feminine and in the singular end in 'e'

  • Rule of thumb: words ending in 'zione', 'ice', and 'ie' are generally feminine
  • Some examples:
    • l'abbreviazione (le abbreviazioni), l'abitudine (le abitudini), l'abside (le absidi), l'alice (le alici), l'anagrafe (le anagrafi), l'anidride (le anidridi), l'arte (le arti), l'asse (le assi), l'assise, l'astronave (le astronavi), la base (le basi), la botte (le botti), la brace (le braci), la canzone (le canzoni), la capitale (le capitali), la caprese (le capresi), la carne (le carni), la cassaforte (le casseforti), la catastrofe (le catastrofi), la classe (le classi), la chiave (le chiavi), la cimice (le cimici), la coesione (le coesioni), la colazione (le colazioni), la collazione (le collazioni), la consonante (le consonanti), la conversazione (le conversazioni), la cornice (le cornici), la corte (le corti), la costante (le costanti), la cuspide (le cuspidi), la deduzione (le deduzioni), la dinamite (le dinamiti), la dose (le dosi), la dote (le doti), l'eclisse (le eclissi), l'ellisse (le ellissi), l'epatite (le epatiti), l'estate (le estati), la fame, la fase (le fasi), la fede (le fedi), la frase (le frasi), la fonte (le fonti), la forbice (le forbice), la frazione (le frazioni), la fronte (le fronti), la funzione (le funzioni), la gente (le genti), la grandine (le grandini), l'indagine (le indagine), l'igiene, l'iniezione (le iniezioni), l’informazione (le informazioni), la lapide (le lapidi) la legge (le leggi), la lentiggine (le lentiggini), la lite (le liti), la latitudine (le latitudini), la longitudine (le longitudini), la luce (le luci), la madre (le madri), la maionese (le maionesi), la manifestazione (le manifestazioni), la matrice (le matrici), la meningite (le meningiti), la mente (le menti), la merce (le merci), la miriade (le miriadi), la moglie (le mogli), la mole (le moli), la morte (le morti), la mutanda (le mutande), la nave (le navi), la neve (le nevi), la notte (le notti), la nube (le nubi), l'origine (le origini), l'otite (le otiti), l'osservazione (le osservazioni), la pace (le paci), la parete (le pareti), la passione (le passioni), la patente (le patenti), la pelle (le pelli), la penale (le penali), la pensione (le pensioni), la pernice (le pernici), la pertosse (le pertossi), la pieve (le pievi), la pisside (le pissidi), la plebe (le plebi), la piramide (le piramidi), la polmonite (le polmoniti), la polvere (le polveri), la posizione (le posizioni), la prigione (le prigioni), la prole (i proli), la propaggine (le propaggini), la questione (le questioni), la radice (le radici), la ragione (le ragioni), la redazione (le redazioni), la redine (le redini), la regione (le regioni), la religione (le religioni), la rete (le reti), la rondine (le rondini), la routine (le routine), la ruggine, la rupe (le rupi), la salsedine (i salsedini), la salute, la scrittrice (le scrittrici), la sede (le sedi), la segale, la selce (le selci), la senape (le senape), la serie (le serie), la sete (le seti), la siepe (le siepi), la sindrome (le sindromi), la solitudine (le solitudini), la sorgente (le sorgenti), la specie (le specie), la stagione (le stagioni), la stele (le stele), la stirpe (le stirpi), le stoviglie, la strage (le stragi), la stupidaggine (le stupidaggini), la superficie (le superfici), la tangenziale (le tangenziali), la tenebra (le tenebre), la tigre (le tigri), la torre (le torri), la tosse (le tossi), la tradizione (le tradizioni), la tranche (le tranche), la trave (le travi), la valle (le valli), la variabile (le variabili), la venere (le veneri), la vernice (le vernici), la vite (le viti), la vocale (le vocali), la voce (le voci), la voragine (le voragini) 

Examples of nouns that are masculine and in the singular end in 'e'

  • Rule of thumb: words ending in 'ore', 'one', 'ale', 'ile', and 'è' are generally masculine
  • Some examples:
    • l'albume (gli albumi), l'allergene (gli allergeni), l'ambiente (gli ambienti), l'amore (gli amore), l'androne (gli androni), l'animale (gli animali), l'aprile, l'architrave (gli architravi), l'arciere (gli arcieri), l'arsenale (gli arsenali), l'aspirapolvere (gli aspirapolvere), l'asteroide (gli asteroide), l'astice (gli astice), l'attaccabrighe (gli attaccabrighe), l'attore (gli attori), l'autore (gli autori), l'alveare (gli alveari), il balcone (i balconi), il bancone (i banconi), il barcone (i barconi), il battente (i battenti), il baule (i bauli), il bene (i beni), il bestiame (i bestiami), il bicchiere (i bicchieri), il bisonte (i bisonti), il bottone (i bottoni), il bracciale (i bracciali), il bue (i buoi), il buffone (i buffoni), il cameriere (i camerieri), il caffè (i caffè), il calzone (i calzoni), il campanile (i campanili), il campione (i campioni), il canale (i canali), il cane (i cani), il canile (i canili), il cannocchiale (i cannocchiali), il canone (i canoni), il cantiere (i cantieri), il capezzale (i capezzali), il cappone (i capponi), il carabiniere (i carabinieri), il carattere (i caratteri), il carbone (i carboni), il carcere (i carceri), il cardinale (i cardinali), il cartone (i cartoni), il cellulare (i cellulari), il ciclone (i cicloni), il clamore (i clamori), il codice (i codici), il coefficiente (i coefficienti), il cognome (i cognomi), il colle (i colli), il colore (i colori), il concime (i concimi), il confine (i confini), il consigliere (i consiglieri), il contenitore (i contenitori), il continente (i continenti), il cortile (i cortili), il costume (i costumi), il cotone (i cotoni), il crescione (i crescioni), il crimine (i crimini), il culmine (i culmini), il cuore (i cuori), il diamante (i diamanti), il dicembre, il dolore (i dolori), il dottore (i dottori), il duce (i duci), l'ente (gli enti), l'equatore, l'eroe (gli eroi), l'errore (gli errori), l'esponente (gli esponenti), l'etere (gli eteri), il elettrone (gli elettroni), il fante (i fanti), il fasciame (i fasciami), il favore (i favori), il fiore (i fiori), il fiume (i fiumi), il flacone (i flaconi), il focolare (i focolari), il fogliame (i fogliami), il folle (i folli), il forte (il forti), il fumatore (i fumatori), il furgone (i furgoni), il furore (i furori), il genere (i generi), il genitore (i genitori), il germe (i germi), il giornale (i giornali), il giudice (i giudici), il glutine (i glutini), il gradiente (i gradienti), il gregge (i greggi), il grifone (i grifoni), l'idrante (gli idranti), l'inferiore (gli inferiori), l'inglese (gli inglesi), l'interesse (gli interessi), l'istante (gli istanti), il karaoke (i karaoke), il lampone (i lamponi), il latte, il legame (i legami), il letame (i letami),  il levante (i levanti), il levriero (i levrieri), il limite (i limiti), il limone (i limoni), il liquore (i liquori), il litorale (i litorali), il livore (i livori), il locale (i locali), il maggiore (i maggiori), il maiale (i maiali), il male (i mali), il mangime (i mangimi), il maquillage, il mare (i mari), il margine (i margini), il marzapane (i marzapani), il materiale (i materiali), il melone (i meloni), il mese (i mesi), il mestiere (i mestieri), il miele (i miele), il milione (i milioni), il minestrone (i minestroni), il missile (i missili), il monsone (i monsoni), il monte (i monti), il motore (i motori), il natale, il neutrone (i neutroni), il nome (i nomi), l'occidentale (gli occidentali), l'occidente, l'ordine (gli ordini), l'orientale (gli orientale), l'oriente, l'orizzonte (gli orizzonti), l'ormone (gli ormoni), l'ospedale (gli ospedali), l'oste (gli osti), l'ottobre, l'ottone (gli ottoni), il padiglione (i padiglioni), il padre (i padri), il paese (i paesi), il pallone (i palloni), il palmipede (i palmipedi), il pallore (i pallori), il pane (i pani), il panforte (i panforti), il pantalone (i pantaloni), il paragone (i paragoni), il parere (i pareri), il parruccone (i parrucconi), il pedone (i pedoni), il pepe, il peperone (i peperoni), il pene (i peni), il pensatore (i pensatori), il pepe (i pepi), il pesce (i pesci), il piacere (i piaceri), il piccione (i piccioni), il piede (i piedi), il pigliamosche (i pigliamosche), il pioniere (i pionieri), il pollame (i pollami), il pollice (i pollici), il polline (i pollini), il polpettone (i polpettoni), il ponte (i ponti), il portale (i portali), il presente (i presenti), il presepe (i presepi), il presidente (i presidenti), il professore (i professori), il propulsore (i propulsori), il protone (i protoni), il puzzle (le puzzle), il quartiere (i quartieri), il rame, il rancore (i rancori), il rappresentante (i rappresentati), il re (i re), il regime (i regimi), il rene (i reni), il rigore (i rigori), il rione (i rioni), il ristorante (i ristoranti), il rituale (i rituali), il rognone (i rognoni), il rumore (i rumori), il sacerdote (i sacerdoti), il salame (i salami), il sale (i sali), il salmone (i salmoni), il salone (i saloni), il sangue (i sangue), il sanitario (i sanitari), il sapone (i saponi), il sartiame (i sartiami), il satellite (i satelliti), lo schienale (gli schienali), lo sciame (gli sciami), il scrittore (i scrittori), lo scroccone (gli scrocconi), il segnale (i segnali), il semaforo (i semafori), il seme (i semi), il serpente (i serpenti), il settembre, il settore (i settori), il signore (i signori), lo spacciatore (gli spacciatori), lo spessore (gli spessori), lo spumante (gli spumanti), il sognatore (i sognatori), il sole (i soli), lo splendore (gli splendori), lo stile (gli stili), lo studente (gli studenti), il sudore (i sudori), il tagliere (i taglieri), il tè (i tè), il temporale (i temporali) il termine (i termini), il terrore (i terrori), il tifone (i tifoni), il timone (i timoni), il tizzone (i tizzoni), il torrente (i torrenti), il totale (i totali), il trattore (i trattori), il tribunale (i tribunali), il tumore (i tumori), l'utensile (gli utensili), l'umore (gli umori), l'usciere (gli uscieri), l'utente (gli utenti), il valore (i valori), il vapore (i vapori), il vate (i vati), il vertice (i vertici), il vinile (i vinili), il volume (i volumi), il vortice (i vortici)      

Examples of nouns that are masculine and in the singular end in 'a'

  • l'amalgama (gli amalgami), il basalioma (i basaliomi), il cinema (i cinema), il clima (i climi), il comunista (i comunisti), il cromosoma (i cromosomi), il diagramma (i diagrammi), il digramma (i digrammi), il dilemma (i dilemmi), il dramma (i drammi), l'edema (gli edemi), il fantasma (i fantasmi), il giornalista (i giornalisti), il grafema (i grafemi), il lemma (i lemmi), il magma (i magmi), il melanoma (i melanomi), il miasma (i miasmi), l'ologramma (gli ologrammi), il papà (i papà), il pianeta (i pianeti), il pigiama (i pigiami), il plasma (i plasmi), il poeta (i poeti), il problema (i problemi), il programma (i programmi), il schema (gli schemi), il sisma (i sismi), il sistema (i sistemi), il tema (i temi), il teorema (i teoremi), il trigramma (i trigrammi)

Examples of nouns that are feminine and in the singular end in 'i'

  • l'analisi (le analisi), l'antesi (le antesi), l'antitesi (le antitesi), la crisi (le crisi), la diatriba (le diatribe), la diocesi (le diocesi), l'ipotesi (le ipotesi), l'isteresi (le isteresi), la metastasi (le metastasi), la metamorfosi (le metamorfosi), la metropoli (le metropoli), la micosi (le micosi), l'osmosi (le osmosi), la paralisi (le paralisi), la protesi (le protesi), la psicosi, la schisi (le schisi), la sepsi (le sepsi), la sintesi (le sintesi), la tesi (le tesi)


Examples of nouns that are masculine and in the singular end in 'i'

  • il bignami, il domani, l'ieri, il lunedì, l'oggi, il martedì, il mercoledì, il giovedì, il taxi, il venerdì


The Scudit 333 essential nouns shows some other categories of nouns that we didn't cover here, including:

  • Nouns that can be either masculine or feminine, for example:
    • abitante, androide, autodidatta, badante, barista, burocrate, cantante, complice, corrente, custode, dentista, dilettante, dorsale, finale, insegnante, megalomane, meridionale, migliore, negromante, nipote, noce, oculista, originale, patente, protagonista, ribelle, regista, rovere, settentrionale, suicida, testimone, turista
  • Nouns that end in a consonant and are masculine, for example:
    • l'autobus, l'est, il design, il nord, l'ovest, il sud
  • Nouns that end in 'o' but are feminine, for example:
    • l'auto (le auto), la foto (le foto), la mano (le mani), la moto (le moto)
  • Nouns that come from another language are generally masculine but not always, for example:
    • l'alcol, (gli alcoli), il bar (i bar), il CD (i CD), il cinema (i cinema), il computer (i computer), il dépliant (i dépliant), il festival (i festival), il film (i film), la gang, la holding, il neon, lo sport (gli sport), lo yogurt (gli yogurt)
We should also mention that there are nouns in Italian that are used mainly in the singular or the plural. In English, we have similar nouns, such as crew, audience, clothes, cahoots, and glasses. (See the Cambridge Dictionary for more examples.) In Italian, these types of nouns are called defective. Reasoning: a noun used mainly in the plural is defective or missing the singular form, and similarly, a noun used mainly in the singular is defective or missing the plural form. You can get a more complete lists of these types of nouns at Treccani and NihilScio. Here are a few examples:

  • Used mainly in the singular
    • l'amore,  l'aprile, il coraggio, il miele, il nord, la pazienza, la prole, il sud
  • Used mainly in the plural
    • le Ande, gli annali, le Dolomiti, le ferie, le mutande, le nozze, i Pirenei, le tenebre, le viscere
And finally, you can always count on Wiktionary to provide you with hours of entertainment. In this case, you can consult the lists suffixes and words by suffixes maintained in the English-language Wiktionary.

No comments:

Post a Comment