Till alla nyhetsbrev -> Alla kluringar -> Förra veckans kluring
Den med alla fotodubbletter…
Jag har hållit på att rensa upp bland alla foton jag har liggandes på datorn. Jag gjorde ett PowerShell-skript som sorterade alla jpg-bilder till olika kataloger enligt formatet
åååå\åååå-mm
och den tog i första hand datumet då fotografiet togs ifrån metadata i filen, och i andra hand tog den datumet då filen skapades om det inte fanns någon metadata. Den flyttade in alla mina bilder i de olika katalogerna.
Men det finns dubbletter! Jag gjorde ett nytt PowerShell-skript som tar fram ett långt tal baserat på vad filen innehåller – och talet räknades ut så att om filerna är exakt lika då blir talet exakt samma, men om minsta lilla pixel skiljer sig, så är det helt olika tal som räknas ut. (SHA256-hashar.)
Så nu har jag en lista över alla mina bilder, och vill få fram – vilka kort ska jag egentligen ta bort? Alltså – vilka är dubbletter? Men – så klart gäller det:
- Jag vill så klart behålla ett av fotona, men ta bort alla andra. Man kan utgå från att den första gången fotot finns i listan (sorterat på datum) är det mest korrekta.
- Jag vill få fram filnamnet inkl sökvägen till filen på alla foton som jag ska ta bort.
Så, det jag vill är få fram en lista på alla foton som är kopia 2 (och eventuellt 3 och 4 osv) av samma fil.
PS. Sedan jag skrev detta har jag märkt att jag kan få falska dubbletter, så jag måste ändra min algoritm, så jag får andra hashvärden, men uppgiften kommer vara exakt likadan, bara andra värden.
PS 2. Äsch, det var jag som gjort lite fel – sha256 håller, men inte han bakom spakarna tydligen! 🙂
Lösningar
Claes löste det så här:
Mats löste det så här:
Patrik gjorde den så här:
Thomas löste uppgiften så här:
Alltid använt den “hårda” transponeringen.
Ska testa den dynamiska.