OT: Doppelte Images finden - the technology behind
Jan-Benedict Glaw
jbglaw at lug-owl.de
Do Apr 26 09:46:07 CEST 2007
On Thu, 2007-04-26 09:40:42 +0200, Steffen Ille <steffenille at web.de> wrote:
> gegeben sind ein oder mehrere Verzeichnisse auf einer Linux-Kiste mit
> jeder Menge (50.000+)
> Bildern. Mit Tools wie "fdupes" findet man einige doppelte Files, weil
> ein MD5 Hash zum Vergleich
> genutzt wird. Bei Dateien (Binaries, Word, etc.) ist das sinnvoll, bei
> Bildern nur bedingt. Wenn
> ich auch Bilder finden will, die zu X % ähnlich sind (gedreht,
> verkleinert, etc) nützt MD5 nichts.
jbglaw at d2:~$ apt-cache search find compare similar images
findimagedupes - Finds visually similar or duplicate images
jbglaw at d2:~$ apt-cache show findimagedupes|grep '^ '
findimagedupes is a commandline utility which performs a rough
"visual diff" to two images. This allows you to compare two
images or a whole tree of images and determine if any are
similar or identical. On common image types, findimagedupes
seems to be around 98% accurate.
.
Homepage: http://www.jhnc.org/findimagedupes/
MfG, JBG
--
Jan-Benedict Glaw jbglaw at lug-owl.de +49-172-7608481
Signature of: 23:53 <@jbglaw> So, ich kletter' jetzt mal ins Bett.
the second : 23:57 <@jever2> .oO( kletter ..., hat er noch Gitter vorm Bett, wie früher meine Kinder?)
00:00 <@jbglaw> jever2: *patsch*
00:01 <@jever2> *aua*, wofür, Gedanken sind frei!
00:02 <@jbglaw> Nee, freie Gedanken, die sind seit 1984 doch aus!
00:03 <@jever2> 1984? ich bin erst seit 1985 verheiratet!
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : nicht verfügbar
Dateityp : application/pgp-signature
Dateigröße : 189 bytes
Beschreibung: Digital signature
URL : http://www.tlug.de/pipermail/tlug_allgemein/attachments/20070426/9d3a29c9/attachment-0001.pgp