Il existe plusieurs principes, qui dépendent du type d’informations que l’on manipule. En ce qui concerne les images ou le texte les méthodes suivantes peuvent être utilisées et / ou combinées :
- Une méthode basée sur la fréquence d’apparition d’un motif : le codage du motif est le plus fréquent est simplifié, celui du moins fréquent est au contraire plus complexe. Un dictionnaire est ajouté afin de permettre d’effectuer la traduction.
Par exemple dans un texte en français c’est le E qui revient le plus souvent, et le w ou le y qui sont les plus rares. Le codage d’un caractère se fait sur un octet (8 bits). Le E sera codé avec deux bits seulement.
Dans une image certaines couleurs reviennent plus souvent que d’autres. L’utilisation d’un histogramme permet de connaître la fréquence d’apparition des couleurs.
- Une autre méthode consiste à repérer des suites de motifs identiques. Au lieu de stocker x fois le même motif, on stocke le motif et le nombre de fois où il est répété.
Ces deux méthodes n’altèrent pas les données.
- Une méthode consiste à supprimer des données originales, toutes les informations qui ne sont pas indispensables : dans le cas d’un morceau de musique, les fréquences inaudibles sont enlevées.