Il rilevamento basato sul contenuto è una tecnica di parsing che identifica un file esaminandone la struttura interna, le intestazioni e gli indicatori di formato invece di fidarsi soltanto dell'estensione del nome file. Gli strumenti di sicurezza, i gestori di archivi e i visualizzatori di documenti lo usano per decidere come elaborare contenuti caricati o ricevuti.
È importante perché le estensioni sono facili da falsificare. Gli aggressori possono rinominare un file per aggirare filtri semplici, ma il parser può comunque riconoscere il formato reale e indirizzare i dati verso il codice che li gestisce. I difensori usano i controlli basati sul contenuto per la validazione dei file, lo screening del malware e la decompressione sicura, confrontando spesso firme, magic bytes e campi strutturali. La stessa tecnica può però anche creare rischi: se un parser classifica in modo errato contenuti malformati o ricade in un gestore vulnerabile, i dati controllati dall'attaccante possono raggiungere percorsi di codice sensibili. Per questo motivo, il rilevamento basato sul contenuto è utile, ma deve essere affiancato da un parsing robusto e da una validazione rigorosa.



