Apache Cassandra je open-sourcový, distribuovaný databázový systém. Jedná se o takzvaný NoSQL systém a ukládá široké sloupce. Slouží ke zpracování velkých objemů dat napříč komoditními servery. Nabízí vysokou dostupnost s absencí pádu skrze jeden bod. Cassandra nabízí robustní podporu klustrů napříč různými datovými centry s asynchronní replikací bez řídícího počítače. To umožňuje nízkou latenci operací pro všechny klienty.
Každý uzel v klusteru má stejnou roli. Neexistuje jediný bod pádu. Data jsou rozložená napříč klusterem, takže každý uzel obsahuje odlišná data, ale neexistuje žádný řídící uzel, protože každý z uzlů může obsloužit libovolný request.
Replikační strategie je možné konfigurovat. Cassandra je navržena tak, aby byla distribuovaným systémem pro deployment velkého množství uzlů napříč různými datovými centry. Klíčovými vlastnostmi distribuované architektury Cassandry jsou, že je specificky navržená pro využití většího množství datových center, přepad a obnovu v případě pádu.
Cassandra je navržena tak, aby bylo možné rozšířit čtení i psaní lineárně, tak jak jsou přidávány nové stroje. Cílem je nulový downtime a absence přerušení chodu aplikace.
Data jsou automaticky replikována na více uzlů. Uzly, které jsou chybové je možné nahradit bez přerušení chodu aplikace.
Cassandra je řazená mezi AP systémy, což znamená, že dostupnost a tolerance partition je obecně považována za důležitější, nežli konzistence. Zápis i čtení nabízí nastavitelnou úroveň konzistence, kdekoliv na škále od „zápis nikdy neselže“ až po „blokovat všechny repliky, aby byly dostupné pro čtení“.
Cassandra má integraci Hadoopu s podporou MapReduce. Podporuje zároveň Apache Pig a Apache Hive.
Cassandra má vlastní Cassandra Query Language nebo CQL. CQL je jednoduchým interface pro přístup do Cassandry. Přidává úroveň abstrakce a skrývá detaily implementace struktury.