Поиск одинаковых строк в excel. Поиск и удаление одинаковых файлов. Если наша борьба с дубликатами допускает исключения

Microsoft Excel достаточно богат на функции анализа диапазонов данных, ранее мы рассматривали каким образом можно , как можно использовать для в двух диапазонах данных, а также визуализацию статистический информации с добавлением функции .

Сегодня поговорим о том, как найти повторяющиеся значения в таблицах Excel. Представленный в статье способ, будет основан на применении условного форматирования. На самом деле способов будет два – один общий, который поможет лучше понять основные принципы работы условного форматирования, а второй простой.

Смотрите также видеоверсию статьи .

Первая часть способа.

Рассмотрим пример нахождения повторяющихся значений.

Для нахождения повторяющихся значений необходимо выполнить следующий пошаговый алгоритм действий:

  1. Выделить исходный диапазон (A1:E8)
  2. Выполнить команду: вкладка Главная / группа Стили / Условное форматирование / Создать правило

  1. В диалоговом окне выбрать: «Использовать формулу для определения форматируемых ячеек», при этом диалоговое окно немного изменит свой вид, далее следует ввести следующую формулу: =СЧЁТЕСЛИ($A$1:$E$8;A1)>1

    после ввода формулы, необходимо выбрать формат, который будет применяться к ячейкам, удовлетворяющим условию (в примере выбрана заливка оранжевым).

  1. После нажатия кнопки «ОК», можно сразу наблюдать результат выполнения операции.

Введенная формула сравнивает значение каждой отдельно взятой ячейки с ячейками из диапазона и, если ячейка не уникальна, то к ней применяется форматирование, в нашем случае, выполняется заливка ячейки оранжевым цветом.

Вторая часть способа.

Иногда возникает необходимость искать не повторяющиеся ячейки, а целые строки.

  1. Основная идея нахождения неуникальных, или, наоборот, уникальных строк, заключается в том, чтобы из всех строк диапазона сделать одну путем конкатенации (соединения), а потом искать неуникальные значений в новом диапазоне. Соединить строки можно, кстати, тоже не одним способом, например, отлично подойдет знак конкатенации «&», равно как и функция .

  1. Следующим шагом будет уже поиск неуникальных строк среди нового столбца, выделение ячеек которого и покажет повторяющиеся строки в первоначальной таблице. Поиск, как и в первой части способа, можно было выполнить с построением формулы, но, можно сделать проще.

В окне построений правил MS Excel, разработчики уже предусмотрели наиболее частые сценарии использования этого инструмента, поэтому можно не вписывать формулу, а выбрать пункт «Форматировать только уникальные или повторяющиеся значения »

  1. После нажатия «ОК», результат не заставит себя долго ждать.

В завершение следует упомянуть, что условное форматирование работает динамически, т.е. если определенные значения в не уникальных строках будут изменены таким образом, что строки станут уникальными, то автоматически поменяется и форматирование. Верно и обратное.

В этом материале речь пойдёт об инструментах выявления дублирующихся фото. В частности, сегодня в нашем обзоре побывают сразу шесть программ для поиска дубликатов фотографий на компьютере под управлением Windows. Мы сравним и выберем среди них лучшие и самые быстрые.

Поиск одинаковых фотографий: программы и их сравнение

Причин востребованности программ для поиска одинаковых фото на компьютере может быть несколько, например:

  • Ваша коллекция могла разрастись настолько, что дубликаты уже занимают немало места;
  • Вам нужен инструмент, который найдёт одинаковые или похожие фотографии, избавив вас от необходимости просматривать эти изображения самостоятельно.

В нашей подборке нашлось место для шести интересных программ, четыре из которых распространяются бесплатно. Ниже по тексту мы:

  1. Расскажем о каждой из этих программ для поиска и поможем вам быстрее сориентироваться в их интерфейсе;
  2. Проведём сравнение всех программ, в котором посмотрим, как они справляются с поиском одинаковых изображений при их лёгком видоизменении;
  3. Проверим насколько программы хорошо могут справиться с большим набором фото весом в несколько гигабайт.

Найти дубликаты фотографий с помощью Image Comparer

Первая программа в нашем обзоре, ищущая дубликаты фото, называется Image Comparer. Её сильные стороны: неплохая функциональность и переведённый на русский язык интерфейс, включая подробную справочную информацию.

Теперь о недостатках. Первый – программа не бесплатная. Впрочем, стоимость лицензии составляет гуманные 350 рублей (хотя на сайте почему-то указана цифра 500). Вдобавок первые 30 дней вы можете использовать Image Comparer бесплатно.

Второй негативный момент заключается в лёгкой запутанности, которая может смутить неопытного пользователя. Например, для того чтобы провести поиск в рамках одной папки (в которую могут быть вложены и другие) вам нужно нажать на кнопку «создать галерею» и выбрать нужный каталог, в котором будет проводиться сканирование.

Далее вам тут же предложат дать имя и сохранить файл создаваемой галереи в любое удобное место (этот файл нужен будет самой программе). Как только это будет сделано, перед вами в виде списка или миниатюр откроется перечень всех изображений в указанной папке и её подпапках:

Кнопки, отмеченные стрелками, запускают поиск дубликатов. Первая кнопка – поиск в рамках одной галереи (выбранной вами папки), вторая кнопка чуть правее – в рамках нескольких галерей. Мы пошли по первому варианту.

Следом программа предложила создать ещё один служебный файл, в котором будут сохраняться результаты для дальнейшего удобного к ним доступа. Собственно, создание файла для галереи и вот этого файла с результатами поиска как раз и может немного запутать неопытного юзера. Впрочем, далее всё уже просто. Перед вами появятся найденные дубликаты:

Их можно просматривать в виде миниатюр или же, щёлкнув по вкладке «пары изображений», перейти к виду, где фотографии будут уже сравниваться между собой:

Ползунок по центру позволяет регулировать порог схожести изображений. Установите 100% и перед вами останется только список идеально похожих друг на друга одинаковых картинок. Более низкие значения отобразят лишь схожие фотографии.

В настройках можно увидеть огромный список форматов от базовых JPG и PNG до более экзотических, с которыми работает программа. Форматы можно добавлять и исключить из поиска. Также можно настроить учёт отражённых и перевёрнутых картинок.

  • Программа Image Comparer. Официальный сайт ;
  • Язык: русский;

Нахождение одинаковых фотографий в три клика с VisiPics

Следующая программа – VisiPics. В отличие от рассмотренной выше Image Comparer, VisiPics является бесплатным приложением, также специализирующемся на дубликатах фото. Увы, локализации на русский здесь нет, но расстраиваться по этому поводу точно не стоит: всё очень просто и предельно понятно.

С помощью боковой панельки навигации (мы обвели её в рамку) выберите нужный каталог. Далее нажмите стрелочку со значком «+», чтобы добавить эту папку в список, по которому будет вестись поиск. При желании таким же образом вы можете выбрать ещё несколько папок. Наконец, третьим шагом нажмите кнопку Play, чтобы запустить процесс нахождения дубликатов.

Справа от неё располагается специальный ползунок, где вы можете настраивать уровень «внимательности» программы. В случае установленного по умолчанию базового уровня VisiPics обнаружила для нас лишь две группы дубликатов, одна из которых состояла из трёх изображений, а другая из двух:

Это те изображения, которые программа считает практически идентичными дубликатами. Однако если вы понизите ползунок до уровня Loose, то находиться будут и просто похожие друг на друга изображения. В нашем случае при установке Loose вместо Basic приложение нашло ещё четыре (в итоговом тесте ниже – 5) группы дубликатов, а одну из двух уже найденных дополнило ещё одной картинкой:

Дополнительных опций у программы относительно немного. Здесь можно настроить поиск в подпапках (по умолчанию он включён), отображение скрытых папок, учёт фотографий, повёрнутых на 90 градусов. На вкладке loader можно попросить VisiPics игнорировать мелкие файлы или, наоборот, картинки в слишком большом разрешении. Последнее важно для скорости.

  • Программа VisiPics. Официальный сайт ;
  • Язык: английский;
  • Распространение: бесплатно.

Программа для поиска дубликатов Awesome Duplicate Photo Finder

Если вы ищете именно предельно простую программу для качественного поиска дублирующихся фото и изображений, в которой было бы элементарно легко разобраться, то обратите внимание на Awesome Duplicate Photo Finder. Интерфейс здесь на английском, но он настолько прост, что разберётся в нём каждый.

С помощью кнопки «+» укажите нужный для поиска каталог или несколько каталогов, после чего нажмите Start Search и по ним начнётся поиск. Опция Scan Subdirectories по умолчанию включена и отвечает за поиск в подпапках. Со своими задачами программа справляется, находя как весьма похожие:

Так и чуть более отличающиеся между собой картинки:

В настройках программы вы можете задать соответствие в 100%, если вам нужны исключительно абсолютно одинаковые фотографии.

Самих настроек, как видите, немного. Пожалуй, самое печальное, что работает программа всего с пятью основными форматами: BMP, JPG, PNG, GIF и TIFF. Причём последний по умолчанию не учитывается.

Также есть опции для обеспечения удаления дубликатов напрямую в корзину и отключения всплывающего подтверждения. Ещё программа умеет обновляться автоматически.

    Официальный сайт ;
  • Язык: английский;
  • Распространение: бесплатно.

Приложение Similar Images Finder встречает нас недобрым сообщением на английском о том, что за него нужно заплатить $34. Тем не менее на протяжении 30 дней программа готова поработать бесплатно. Следом появляется окно, предлагающее выбрать каталоги для поиска дубликатов:

Из него же мы узнаём, что Similar Images Finder поддерживает 29 форматов изображений, причём пользователь может выбирать конкретные форматы для поиска или исключать лишние. В списке, помимо прочего, можно наблюдать ico и wbmp.

При нажатии Next вы запустите поиск дубликатов, а когда он будет закончен, нажмите Next ещё раз, чтоб увидеть дополнительные настройки. Регулируя их, вы сможете более тщательно настроить то, что отобразится в списке результатов. Наконец, нажав Next в третий раз, вы увидите уже и сам результат:

Перейти к следующей найденной картинке можно нажатием миниатюрной стрелочки в верхнем правом углу. Весь список найденных дубликатов открывается кликом по большой кнопке вверху с адресами текущих файлов.

В свою очередь, нажатие кнопки Next внизу приведёт к завершающему этапу работы. Там программа выведет список того, что, по её мнению, точно является дубликатами и предложит их удалить. На скриншоте выше Similar Images Finder справилась с изображением, куда был добавлен водяной знак, а также изменён контраст гистограммы.

Различая между картинками программа посчитала на уровне 5,5%. При этом в другом примере, где на вторую картинку нами был добавлен сильный эффект размытия, отличия, по версии приложения, почему-то составили всего 1,2%:

Увы, программа, находя реальные дубликаты, по умолчанию показывает и многие совсем непохожие друг на друга изображения, как будто в них есть что-то общее:

  • Программа Similar Images Finder. Официальный сайт ;
  • Язык: английский;
  • Распространение: платно, 30 дней бесплатного использования.

Универсальный поиск дубликатов с Duplicate Remover Free

Duplicate Remover Free – единственная в нашем обзоре программа, которая сосредоточена всё же не конкретно на дубликатах фотографий, а на поиске дубликатов в целом.

Как показывает практика, такие универсальные решения не очень хорошо проявляют себя в задачах, связанных с какой-то более узкой областью.

Однако одной такой программе мы сегодня даём шанс. Как подсказывает слово Free – распространяется она бесплатно. Вторым достоинством приложения является русский язык, а третьим – относительная современность на фоне других программ в этой подборке, многие из которых, к огромному сожалению, не обновлялись уже долгие годы.

Вам следует кликнуть по кнопке «добавить директорию» и выбрать нужные папки. По умолчанию программа в заданном каталоге не нашла для нас вообще ничего, однако, когда вверху вместо «точные дубликаты» мы выбрали пункт «похожие изображения», тут же были найдены четыре группы дубликатов, одна из которых состояла сразу из трёх файлов:

Дополнительных возможностей у приложения совсем немного. В частности, вы можете исключать из поиска файлы до и после определённого размера.

  • Программа Duplicate Remover Free. Официальный сайт ;
  • Язык: русский;
  • Распространение: бесплатно.

Поиск совпадающих фото по различным алгоритмам с AntiDupl

Заключительный участник нашего обзора – программа AntiDupl может приглянуться вам сразу по нескольким причинам. Во-первых, она бесплатная. Во-вторых, у неё русский интерфейс. Последнее, впрочем, не очевидно. Для того чтобы включить русский, откройте меню View и в разделе Language выберете соответствующий пункт:

В отличие от других, эта программа не инсталлируется, а находится в самораспаковывающемся архиве, который извлекает её вместе с необходимыми файлами в отдельную папку.

Чтобы подготовить поиск дубликатов кликните по кнопке с подписью Open и в появившемся окне добавьте нужные каталоги:

Следом можно нажимать Ок, а потом активировать на панели инструментов зелёную кнопку «начать поиск». Используя базовый алгоритм, программа нашла для нас несколько групп дубликатов:

Переключив вверху алгоритм на более вольный SSIM, мы получили уже на две группы дубликатов больше, а после увеличения «свободы» поиска с 20 до 35% программа выдала нам ещё более подробный список:

При этом во всех случаях действительно нашлись как минимум заметно похожие друг на друга изображения. Так что не брезгуйте экспериментировать с настройками.

Дополнительных опций у программы немало:

На вкладке «поиск» можно узнать, что AntiDupl поддерживает 13 форматов, среди которых помимо традиционных JPG/PNG, есть ICON, PSD и EXIF. Разумеется, форматы можно выбирать. Ещё в опциях есть проверка на дефекты, блочность и размытость, причём в последних двух случаях можно задавать порог. Есть возможность искать в скрытых и системных каталогах.

  • Программа AntiDupl. ;
  • Язык: русский;
  • Распространение: бесплатно.

При поиске дубликатов часть пользователей интересует именно 100% соответствие, чтобы избавиться от дублей в своей коллекции. Однако нередко возникает и задача найти просто похожие картинки.

И вот здесь огромное пространство для возможных отличий. Этот могут быть разные форматы, разрешения, обрезанные версии одного и того же изображения, добавление рамок и водяных знаков, изменённые цвета и подписи на картинках.

Мы постарались учесть большинство из этих факторов и после всех проб создали в итоге небольшой набор с более чем шестью десятками картинок. В них мы создали девять групп дубликатов. Скажем честно, на истину в последней инстанции наш опыт точно не претендует, но попробовать было интересно. Результаты следующие:

  • Duplicate Remover Free: нашёл лишь 3 группы дубликатов;
  • Similar Images Finder: нашёл 4 группы, но неудобный интерфейс, множество ложных результатов и при этом платность приложения сильно испортили общее впечатление;
  • AntiDupl по умолчанию нашёл 3 типа дубликатов, установка алгоритма SSIM увеличила результат поиска до 5 групп;
  • VisiPics при базовом уровне поиска нашёл лишь 2 группы дубликатов, однако установка ползунка на уровень Loose позволила найти уже 7 групп;
  • Awesome Duplicate Photo Finder нашёл 7 групп дубликатов;
  • Image Comparer также сумел обнаружить 7 групп.

При этом Image Comparer сумел найти изображения, которые пропустили Awesome Duplicate Photo Finder и VisiPics, а те, в свою очередь, восполнили пробелы Image Comparer.

Самые быстрые программы для поиска дубликатов фото

В то же время, качество программы ещё зависит и от её скорости. 60+ картинок – это, конечно же, не то, с чем могут работать пользователи. Поэтому мы провели ещё один тест. На этот раз на скорость. Для этого мы взяли подборку из 4450 самых разных изображений, общий вес которой превысил 2.1 ГБ.

Две программы из этого обзора, увы, в тесте не заняли никакого места. Как выяснилось, Similar Images Finder, за который просят 34 доллара, в бесплатной версии готов зараз обработать не более 200 изображений.

В свою очередь, универсальный поисковик дубликатов Duplicate Remover Free, столкнувшись с каталогом серьёзного размера, более пяти минут интенсивно работал, а потом основательно завис. Остальные программы показали следующее время:

  • AntiDupl: 0:39;
  • Image Comparer: 1:02 (35 секунд на создание галереи и 27 на поиск);
  • VisiPics: 2:37;
  • Awesome Duplicate Photo Finder: 3:17.

В итоге в тесте на скорость в лидеры явно выбились Image Comparer и AntiDupl. На обработку нашего архива у них ушло около или же, в случае AntiDupl, меньше минуты.

Заключение

Подведём итоги. Если вам нужно найти не одинаковые, а именно похожие фотографии, отличающиеся, например, подписью или водяным знаком, то лучше остальных с этой задачей справятся Image Comparer, Awesome Duplicate Photo Finder и VisiPics в режиме работы Loose.

В плане скорости обработки многочисленной коллекции изображений безусловные лидеры – AntiDupl и Image Comparer.

Наконец, в плане удобства интерфейса нам понравились Image Comparer и VisiPics, с ходу позволяющие визуально оценить все группы дубликатов. В свою очередь, за наглядность сравнения характеристик отдельных дубликатов мы также отметим AntiDupl.

Привет всем. Сегодня я хочу рассказать вам, как найти повторяющиеся значения в Excel и что с ними можно сделать. Если вам приходиться работать с таблицей, где есть дублирующиеся данные, то хотелось бы знать, как их отыскать. Именно этим, в этом уроке, мы и займемся.

Для примера я взял вот такую таблицу. Взял людей из какой-то группы вКонтакте, разделил имена и фамилии, и наделал несколько ячеек с дублями.

Выделяем цветом дубликаты в таблице

Первым способом я покажу вам, каким образом можно найти дубликаты и выделить их цветом. Это может вам потребоваться, для сравнения каких-либо данных без их удаления. В моем примере это будут одинаковые имена и фамилии людей.

Открывает вкладку «Главная», в разделе «Стили» выбираем «Условное форматирование» — «Правила выделения ячеек» — «Повторяющиеся значения».

Открылось окно, в котором есть два пункта: что выделить – уникальные или повторяющиеся значения, и, как их выделить – в какую цветовую гамму. И, конечно же, кнопка «ОК».

Чтобы поиск был осуществлен не по всей таблице, предварительно выделите один или несколько столбцов.

Посмотрите на мой результат. Правда такой способ имеет существенный недостаток: нет выборки, выделяет все, что встречается более одного раза.

Выборочная подсветка или удаление одинаковых значений в Excel

Способ, может быть, банальный, но действенный. Воспользуемся функцией «Поиск».

Открывает вкладку «Главная» — раздел «Редактирование» — «Найти и выделить» (CTRL+F).

В окне в поле «Найти» набираем, что мы ищем. Затем жмем по кнопке «Найти все», нажимаем сочетание клавиш CTRL+A, чтобы выделить все результаты поиска, и выделяю их цветом. Так же их можно удалить, а не выделять.

Удаляем все одинаковые значения в Excel с помощью расширенного фильтра

Для использования расширенного фильтра, выберем любую ячейку в таблице. Я выбрал верхнюю левую. Затем открываем вкладку «Данные», переходим в раздел «Сортировка и фильтр», и жмем по кнопке «Дополнительно».

Теперь нужно настроить в этом окне, каким образом будет произведена фильтровка. Можно скопировать результаты фильтра в другое место (ставим галочку и указываем место, куда скопируется результат), либо результат оставить в том же месте. И, обязательно, ставим галочку «Только уникальные значения».

Вот мой результат применения к таблице расширенного фильтра. Как видим, в результате Excel смог найти и удалить дубликаты.

Еще один способ быстро удалить дубли в таблице

Этот способ удалит все одинаковые значения, которые встречаются в таблице. Если вам нужен поиск только в некоторых столбцах, то выделите их.

Теперь откройте вкладку «Данные», раздел «Работа с данными», «Удалить дубликаты».

Расставим нужные галочки. Мне нужен поиск по двум столбцам, потому оставляю, как есть, и жму на кнопку «ОК».

На этом метод закончился. Вот мой результат его работы.

Спасибо за прочтение. Не забывайте делиться с друзьями с помощью кнопок социальных сетей, и комментируйте.

Распространенный вопрос как найти и удалить дубликаты в Excel. Предположим вы выгрузили месячный отчет из вашей учетной системы, но в итоге вам нужно понять какие контрагенты вообще взаимодействовали с компанией за этот период — оставить список контрагентов без повтарений. Как отобрать уникальные значения?

Можно ли удалить задвоеные, затроенные и так далее значения в Excel по нескольким столбцам?

Можно, причем очень просто. Для этого есть специальная функция. Предварительно выберите диапазон, где нужно удалять дубликаты. На ленте заходим Данные — Удалить дубликаты (смотрите картинку в начале статьи).

Выбираем первый столбец

При этом важно понимать, что если вы выберите только первый столбец, то все данные в не выбранных столбцах удаляться в случае неуникальности.

Очень удобно!

2. Как выделить все дубликаты в Excel?

Уже слышали про ? Да, здесь оно еще как поможет! Выделяете столбец в котором надо пометить дубликаты, выбираете в меню Главное — Условное форматирование — Правила выделения ячеек — Повторяющиеся значения…

В открывшемся окне Повторяющиеся значения, выберите какие ячейки выделяем (уникальные или повторяющиеся), а так же формат выделения, либо из преложенных, либо создайте Пользовательский формат. Предустановлено форматом будет красная заливка и красный текст.

Нажимаете ОК, если не хотите изменять форматирование. Теперь все данные по выбранным условиям подкрасятся.

Отмечу, что инструмент применяется только для выбранного одного (!) столбца.

Кстати, если нужно увидеть уникальные, то в окне слева выберите — уникальные.

3. Уникальные значения при помощи сводных таблиц

Признаюсь честно, когда-то я не подозревал о существовании возможности «удалить дубликаты» и пользовался сводными таблицами. Как я это делал? Выделяете таблицу, в которых надо найти уникальные значения — Вставка —

Поиск дублей в Excel – это одна из самых распространенных задач для любого офисного сотрудника. Для ее решения существует несколько разных способов. Но как быстро как найти дубликаты в Excel и выделить их цветом? Для ответа на этот часто задаваемый вопрос рассмотрим конкретный пример.

Как найти повторяющиеся значения в Excel?

Допустим мы занимаемся регистрацией заказов, поступающих на фирму через факс и e-mail. Может сложиться такая ситуация, что один и тот же заказ поступил двумя каналами входящей информации. Если зарегистрировать дважды один и тот же заказ, могут возникнуть определенные проблемы для фирмы. Ниже рассмотрим решение средствами условного форматирования.

Чтобы избежать дублированных заказов, можно использовать условное форматирование, которое поможет быстро найти одинаковые значения в столбце Excel.

Пример дневного журнала заказов на товары:

Чтобы проверить содержит ли журнал заказов возможные дубликаты, будем анализировать по наименованиям клиентов – столбец B:


Как видно на рисунке с условным форматированием нам удалось легко и быстро реализовать поиск дубликатов в Excel и обнаружить повторяющиеся данные ячеек для таблицы журнала заказов.



Пример функции СЧЁТЕСЛИ и выделение повторяющихся значений

Принцип действия формулы для поиска дубликатов условным форматированием – прост. Формула содержит функцию =СЧЁТЕСЛИ(). Эту функцию так же можно использовать при поиске одинаковых значений в диапазоне ячеек. В функции первым аргументом указан просматриваемый диапазон данных. Во втором аргументе мы указываем что мы ищем. Первый аргумент у нас имеет абсолютные ссылки, так как он должен быть неизменным. А второй аргумент наоборот, должен меняться на адрес каждой ячейки просматриваемого диапазона, потому имеет относительную ссылку.

Самые быстрые и простые способы: найти дубликаты в ячейках .

После функции идет оператор сравнения количества найденных значений в диапазоне с числом 1. То есть если больше чем одно значение, значит формула возвращает значение ИСТЕНА и к текущей ячейке применяется условное форматирование.

Статьи по теме