Обработка прямо на вашем устройстве

PDF в Excel: извлечение таблиц в .xlsx

Достаньте табличные данные из PDF и получите готовый файл Excel, с которым можно считать и сортировать. Инструмент раскладывает текст по строкам и сохраняет результат в .xlsx — прямо в браузере, без отправки файла на сервер. Скажем сразу и честно: это извлечение строк, а не умное распознавание сложных таблиц, поэтому ниже мы разбираем, какие таблицы переносятся хорошо, а с какими придётся поработать руками.

или перетащите сюда — файл не уходит на сервер

Честный результат

Мы прямо говорим: простые таблицы лягут хорошо, сложные потребуют ручной правки в Excel.

Полная приватность

Файл обрабатывается в браузере и не уходит на сервер — подходит для таблиц с чувствительными данными.

Готово к расчётам

Данные попадают в .xlsx и сразу доступны для сортировки, фильтров и формул.

Быстро и без установки

Не нужен Excel и сторонние программы: загрузили PDF — получили таблицу за секунды.

Что на самом деле делает этот инструмент

Инструмент читает текстовый слой PDF, определяет, какие фрагменты стоят на одной строке, и раскладывает их по строкам и ячейкам файла Excel. Важно понимать механику: PDF не хранит таблицу как таблицу — он хранит, где именно на странице стоит каждый кусочек текста.

Инструмент восстанавливает табличную структуру по расположению данных: то, что идёт в одну линию по горизонтали, попадает в одну строку .xlsx. Это работает хорошо, когда таблица ровная и колонки чётко разделены.

Но там, где ячейки объединены, где есть многострочные записи или где колонки «плывут», простой разбор по строкам ошибётся — и результат придётся поправить. Поэтому мы называем это извлечением данных, а не идеальной конвертацией таблиц.

✓ Плюсы
  • Данные попадают в .xlsx и сразу доступны для сортировки и формул.
  • Простые ровные таблицы раскладываются по строкам аккуратно.
  • Работает в браузере, без Excel и без загрузки файла на сервер.
✕ Минусы
  • Объединённые ячейки разбираются неверно.
  • Многострочные записи в ячейке могут разъехаться по строкам.
  • Сканы не поддерживаются — распознавания образов здесь нет.

Какие таблицы переносятся хорошо

Идеальный кандидат — простая «плоская» таблица: строки-записи, ровные колонки, по одному значению в ячейке, без объединений и вложенности. Такие таблицы встречаются в выписках и реестрах, прайс-листах, списках товаров, ведомостях, расписаниях, простых финансовых отчётах и экспортах из учётных систем.

Если в вашем PDF данные выстроены аккуратными рядами и каждая колонка отделена от соседней, инструмент разложит их по ячейкам почти без потерь, и файл сразу можно фильтровать и считать. Признак хорошего исходника тот же, что и всегда: текст в PDF выделяется и копируется мышью, а сама таблица выглядит как ровная сетка без хитрых объединений.

Где начинаются ограничения

Сложности возникают там, где таблица перестаёт быть простой сеткой. Объединённые ячейки — самый частый источник ошибок: инструмент не знает, что одна большая ячейка накрывает три строки, и разложит данные не так, как задумывал автор.

Многострочный текст внутри ячейки (например, длинное описание в одну колонку) может разъехаться на несколько строк Excel. Таблицы без явных границ, где колонки разделены только пробелами, иногда «слипаются» — соседние значения попадают в одну ячейку.

Вложенные заголовки, ячейки в несколько уровней, подытоги внутри таблицы тоже собьют разметку. Это не поломка, а предел простого построчного подхода: в таких случаях считайте результат черновиком, который нужно выровнять в Excel вручную.

✓ Плюсы
  • Ровная таблица с одиночными значениями — почти без правок.
  • Числовые реестры и прайсы раскладываются предсказуемо.
✕ Минусы
  • Объединённые и многоуровневые ячейки требуют ручной сборки.
  • Колонки без границ могут слипнуться в одну ячейку.
  • Итоги и подзаголовки внутри таблицы сбивают структуру.

Почему сканы не поддерживаются

Инструмент работает только с текстовым слоем PDF — тем, что можно выделить и скопировать мышью. Если ваш файл получен сканированием или фотографированием бумаги, внутри лежит картинка, а не текст, и раскладывать по ячейкам нечего.

Чтобы «увидеть» цифры и буквы на изображении, нужна технология распознавания (OCR), которая анализирует картинку и угадывает символы, — здесь её нет намеренно. Зато то, что инструмент делает, он делает быстро, точно и без отправки файла куда-либо.

Проверить исходник просто: откройте PDF в просмотрщике и попробуйте выделить ячейку таблицы. Текст выделяется — инструмент справится.

Выделяется вся страница картинкой — это скан, и его нужно сначала распознать.

Что делать со сложными таблицами и сканами

Если таблица сложная, самый быстрый путь — извлечь то, что получится, а затем выровнять данные в Excel: сдвинуть колонки, разбить слипшиеся ячейки функцией «Текст по столбцам», убрать лишние строки. Для сканов сначала нужен OCR: прогоните файл через Adobe Acrobat, ABBYY FineReader или онлайн-сервис распознавания, чтобы внутри появился текстовый слой, и только потом переносите в Excel.

Если таблица очень запутанная — с множеством объединений и уровней — иногда честнее перенабрать ключевые цифры вручную, чем чинить разъехавшуюся сетку. Мы указываем на это прямо, чтобы вы выбрали кратчайший путь, а не боролись с инструментом там, где он бессилен.

Какие таблицы переносятся и что делать со сложными
Тип таблицыКак выглядитРезультат в .xlsxЧто делать
Простая плоскаяРовная сетка, по одному значению в ячейкеРаскладывается аккуратноПросто загрузить файл
С объединёнными ячейкамиОдна ячейка накрывает несколько строкДанные разъезжаютсяВыровнять вручную в Excel
Без границ колонокКолонки разделены только пробеламиЗначения могут слипнутьсяРазбить «Текст по столбцам»
Скан / фотоТаблица — это картинка, текст не копируетсяПустоСначала OCR, затем перенос

Приватность: данные остаются у вас

Вся обработка идёт в браузере на вашем устройстве — PDF не загружается на сервер, не сохраняется в облаке и не попадает к посторонним. Для таблиц это особенно важно: в них часто лежат чувствительные данные — суммы, персональные сведения клиентов, финансовые показатели, коммерческие условия.

Обычный онлайн-конвертер сначала отправляет ваш файл на чужой сервер, и вы не контролируете, что с ним будет и как долго он там пролежит. Здесь этого шага нет: файл никуда не уходит, а после закрытия вкладки от него не остаётся следов.

Если страница уже загружена, инструмент работает даже без интернета — данные не покидают компьютер ни на секунду.

Как выжать максимум из результата

Несколько приёмов заметно облегчают жизнь.

Во-первых, берите исходный текстовый PDF, а не скан: чем чище текстовый слой, тем аккуратнее разложатся данные.

Во-вторых, для сложных таблиц воспринимайте .xlsx как черновик — открывайте функцию «Текст по столбцам», чтобы быстро разделить слипшиеся значения, и «Найти и заменить», чтобы почистить лишние символы.

В-третьих, проверяйте числовые колонки: иногда после переноса числа воспринимаются как текст, и достаточно сменить формат ячеек, чтобы заработали формулы.

В-четвёртых, если нужна только часть большой таблицы, быстрее извлечь всё и удалить лишнее в Excel. И помните главное: задача инструмента — вернуть вам данные в редактируемом виде, а финальную чистоту таблицы наводите уже средствами Excel.

Как это сделать

  1. Откройте инструмент и загрузите PDF-файл с таблицей — с компьютера или перетаскиванием в окно браузера.
  2. Проверьте, что это текстовый PDF: в просмотрщике ячейки таблицы должны выделяться и копироваться мышью.
  3. Запустите извлечение — инструмент разложит данные по строкам прямо на вашем устройстве, без отправки на сервер.
  4. Дождитесь готового файла .xlsx — для ровных таблиц это занимает несколько секунд.
  5. Скачайте результат и откройте его в Excel, LibreOffice Calc или Google Таблицах.
  6. Выровняйте данные при необходимости: разбейте слипшиеся ячейки через «Текст по столбцам» и проверьте формат чисел.

Частые вопросы

Нет, и мы говорим об этом честно. Инструмент раскладывает текст по строкам, ориентируясь на его расположение в PDF, а не разбирает сложную логику таблицы.

Простые ровные таблицы переносятся хорошо, а таблицы с объединёнными ячейками, вложенными заголовками и подытогами придётся выравнивать в Excel вручную. Считайте результат по сложным таблицам черновиком, а не готовым отчётом.

Скорее всего, вы загрузили скан — фотографию или отсканированный образ страницы. Внутри такого PDF нет текстового слоя, только картинка, а распознавать образы инструмент не умеет: для этого нужна технология OCR, которой здесь нет.

Прогоните файл через распознавание (Adobe Acrobat, ABBYY FineReader, онлайн-сервисы OCR), чтобы появился текст, и повторите извлечение.

Откройте PDF в просмотрщике и попробуйте выделить и скопировать ячейку мышью. Если текст копируется, а таблица выглядит как ровная сетка без объединённых ячеек — извлечение пройдёт хорошо.

Если выделяется вся страница картинкой, это скан, и нужен OCR. Если таблица есть, но она с множеством объединений и уровней — данные извлекутся, но результат придётся выравнивать.

Они — главный источник ошибок. Инструмент раскладывает данные по строкам и не знает, что одна большая ячейка накрывает несколько строк или колонок, поэтому значения разъезжаются не так, как задумал автор таблицы.

После извлечения такие места придётся собрать вручную в Excel. Если объединений в таблице много, планируйте время на ручную доработку результата.

Нет, вся обработка идёт в браузере на вашем устройстве. PDF не загружается на сервер, не сохраняется в облаке и не передаётся третьим лицам — это особенно важно для таблиц с суммами, персональными данными клиентов и коммерческими условиями.

После закрытия вкладки от файла не остаётся следов. Если страница уже открыта, инструмент работает даже без интернета.

После переноса числа иногда попадают в ячейки как текст, а не как числовой формат, и формулы их «не видят». Это легко исправить: выделите колонку и смените формат ячеек на числовой, либо используйте функцию «Текст по столбцам», которая заодно приведёт значения к числам.

Иногда мешают лишние пробелы или разделители — их убирают через «Найти и заменить».

Так бывает с таблицами, где колонки разделены только пробелами, без явных границ: инструмент не всегда понимает, где заканчивается одна колонка и начинается другая. Решение простое — в Excel выделите проблемную колонку и примените «Текст по столбцам», указав разделитель (пробел или другой символ).

Данные разложатся по отдельным ячейкам, и таблицу можно будет использовать дальше.

В любой, что понимает формат Excel: Microsoft Excel, бесплатный LibreOffice Calc, WPS Spreadsheets, Google Таблицы, Numbers на Mac и мобильные редакторы таблиц. Файл сохраняется в стандартном .xlsx, поэтому проблем с совместимостью не будет.

Открыв его, вы сразу сможете сортировать, фильтровать данные, строить формулы и приводить таблицу в нужный вид.