Il contenuto del Web si stima attualmente in trilioni di pagine. Stima sicuramente in difetto che ignora molte risorse (Deep Web) che non sono direttamente accessibili dai motori di ricerca e che quindi non vengono indicizzate. Una gran parte di queste pagine sono in Inglese ma sempre di più aumentano quelle in altre lingue come ad esempio il cinese, come aumentano il numero di utenti del web che non sono anglofoni. Molti paesi e in primis la comunità europea, dove risiedono 27 paesi dove si parlano 23 lingue, si trovano impegnati nella individuazione di tecnologie web, nell'individuazione di best practice e nella realizzazione di tool atti a superare questa barriera linguistico-culturale.