Честный результат
Мы прямо говорим: простые таблицы лягут хорошо, сложные потребуют ручной правки в Excel.
Достаньте табличные данные из PDF и получите готовый файл Excel, с которым можно считать и сортировать. Инструмент раскладывает текст по строкам и сохраняет результат в .xlsx — прямо в браузере, без отправки файла на сервер. Скажем сразу и честно: это извлечение строк, а не умное распознавание сложных таблиц, поэтому ниже мы разбираем, какие таблицы переносятся хорошо, а с какими придётся поработать руками.
или перетащите сюда — файл не уходит на сервер
Мы прямо говорим: простые таблицы лягут хорошо, сложные потребуют ручной правки в Excel.
Файл обрабатывается в браузере и не уходит на сервер — подходит для таблиц с чувствительными данными.
Данные попадают в .xlsx и сразу доступны для сортировки, фильтров и формул.
Не нужен Excel и сторонние программы: загрузили PDF — получили таблицу за секунды.
Инструмент читает текстовый слой PDF, определяет, какие фрагменты стоят на одной строке, и раскладывает их по строкам и ячейкам файла Excel. Важно понимать механику: PDF не хранит таблицу как таблицу — он хранит, где именно на странице стоит каждый кусочек текста.
Инструмент восстанавливает табличную структуру по расположению данных: то, что идёт в одну линию по горизонтали, попадает в одну строку .xlsx. Это работает хорошо, когда таблица ровная и колонки чётко разделены.
Но там, где ячейки объединены, где есть многострочные записи или где колонки «плывут», простой разбор по строкам ошибётся — и результат придётся поправить. Поэтому мы называем это извлечением данных, а не идеальной конвертацией таблиц.
Идеальный кандидат — простая «плоская» таблица: строки-записи, ровные колонки, по одному значению в ячейке, без объединений и вложенности. Такие таблицы встречаются в выписках и реестрах, прайс-листах, списках товаров, ведомостях, расписаниях, простых финансовых отчётах и экспортах из учётных систем.
Если в вашем PDF данные выстроены аккуратными рядами и каждая колонка отделена от соседней, инструмент разложит их по ячейкам почти без потерь, и файл сразу можно фильтровать и считать. Признак хорошего исходника тот же, что и всегда: текст в PDF выделяется и копируется мышью, а сама таблица выглядит как ровная сетка без хитрых объединений.
Сложности возникают там, где таблица перестаёт быть простой сеткой. Объединённые ячейки — самый частый источник ошибок: инструмент не знает, что одна большая ячейка накрывает три строки, и разложит данные не так, как задумывал автор.
Многострочный текст внутри ячейки (например, длинное описание в одну колонку) может разъехаться на несколько строк Excel. Таблицы без явных границ, где колонки разделены только пробелами, иногда «слипаются» — соседние значения попадают в одну ячейку.
Вложенные заголовки, ячейки в несколько уровней, подытоги внутри таблицы тоже собьют разметку. Это не поломка, а предел простого построчного подхода: в таких случаях считайте результат черновиком, который нужно выровнять в Excel вручную.
Инструмент работает только с текстовым слоем PDF — тем, что можно выделить и скопировать мышью. Если ваш файл получен сканированием или фотографированием бумаги, внутри лежит картинка, а не текст, и раскладывать по ячейкам нечего.
Чтобы «увидеть» цифры и буквы на изображении, нужна технология распознавания (OCR), которая анализирует картинку и угадывает символы, — здесь её нет намеренно. Зато то, что инструмент делает, он делает быстро, точно и без отправки файла куда-либо.
Проверить исходник просто: откройте PDF в просмотрщике и попробуйте выделить ячейку таблицы. Текст выделяется — инструмент справится.
Выделяется вся страница картинкой — это скан, и его нужно сначала распознать.
Если таблица сложная, самый быстрый путь — извлечь то, что получится, а затем выровнять данные в Excel: сдвинуть колонки, разбить слипшиеся ячейки функцией «Текст по столбцам», убрать лишние строки. Для сканов сначала нужен OCR: прогоните файл через Adobe Acrobat, ABBYY FineReader или онлайн-сервис распознавания, чтобы внутри появился текстовый слой, и только потом переносите в Excel.
Если таблица очень запутанная — с множеством объединений и уровней — иногда честнее перенабрать ключевые цифры вручную, чем чинить разъехавшуюся сетку. Мы указываем на это прямо, чтобы вы выбрали кратчайший путь, а не боролись с инструментом там, где он бессилен.
| Тип таблицы | Как выглядит | Результат в .xlsx | Что делать |
|---|---|---|---|
| Простая плоская | Ровная сетка, по одному значению в ячейке | Раскладывается аккуратно | Просто загрузить файл |
| С объединёнными ячейками | Одна ячейка накрывает несколько строк | Данные разъезжаются | Выровнять вручную в Excel |
| Без границ колонок | Колонки разделены только пробелами | Значения могут слипнуться | Разбить «Текст по столбцам» |
| Скан / фото | Таблица — это картинка, текст не копируется | Пусто | Сначала OCR, затем перенос |
Вся обработка идёт в браузере на вашем устройстве — PDF не загружается на сервер, не сохраняется в облаке и не попадает к посторонним. Для таблиц это особенно важно: в них часто лежат чувствительные данные — суммы, персональные сведения клиентов, финансовые показатели, коммерческие условия.
Обычный онлайн-конвертер сначала отправляет ваш файл на чужой сервер, и вы не контролируете, что с ним будет и как долго он там пролежит. Здесь этого шага нет: файл никуда не уходит, а после закрытия вкладки от него не остаётся следов.
Если страница уже загружена, инструмент работает даже без интернета — данные не покидают компьютер ни на секунду.
Несколько приёмов заметно облегчают жизнь.
Во-первых, берите исходный текстовый PDF, а не скан: чем чище текстовый слой, тем аккуратнее разложатся данные.
Во-вторых, для сложных таблиц воспринимайте .xlsx как черновик — открывайте функцию «Текст по столбцам», чтобы быстро разделить слипшиеся значения, и «Найти и заменить», чтобы почистить лишние символы.
В-третьих, проверяйте числовые колонки: иногда после переноса числа воспринимаются как текст, и достаточно сменить формат ячеек, чтобы заработали формулы.
В-четвёртых, если нужна только часть большой таблицы, быстрее извлечь всё и удалить лишнее в Excel. И помните главное: задача инструмента — вернуть вам данные в редактируемом виде, а финальную чистоту таблицы наводите уже средствами Excel.
Нет, и мы говорим об этом честно. Инструмент раскладывает текст по строкам, ориентируясь на его расположение в PDF, а не разбирает сложную логику таблицы.
Простые ровные таблицы переносятся хорошо, а таблицы с объединёнными ячейками, вложенными заголовками и подытогами придётся выравнивать в Excel вручную. Считайте результат по сложным таблицам черновиком, а не готовым отчётом.
Скорее всего, вы загрузили скан — фотографию или отсканированный образ страницы. Внутри такого PDF нет текстового слоя, только картинка, а распознавать образы инструмент не умеет: для этого нужна технология OCR, которой здесь нет.
Прогоните файл через распознавание (Adobe Acrobat, ABBYY FineReader, онлайн-сервисы OCR), чтобы появился текст, и повторите извлечение.
Откройте PDF в просмотрщике и попробуйте выделить и скопировать ячейку мышью. Если текст копируется, а таблица выглядит как ровная сетка без объединённых ячеек — извлечение пройдёт хорошо.
Если выделяется вся страница картинкой, это скан, и нужен OCR. Если таблица есть, но она с множеством объединений и уровней — данные извлекутся, но результат придётся выравнивать.
Они — главный источник ошибок. Инструмент раскладывает данные по строкам и не знает, что одна большая ячейка накрывает несколько строк или колонок, поэтому значения разъезжаются не так, как задумал автор таблицы.
После извлечения такие места придётся собрать вручную в Excel. Если объединений в таблице много, планируйте время на ручную доработку результата.
Нет, вся обработка идёт в браузере на вашем устройстве. PDF не загружается на сервер, не сохраняется в облаке и не передаётся третьим лицам — это особенно важно для таблиц с суммами, персональными данными клиентов и коммерческими условиями.
После закрытия вкладки от файла не остаётся следов. Если страница уже открыта, инструмент работает даже без интернета.
После переноса числа иногда попадают в ячейки как текст, а не как числовой формат, и формулы их «не видят». Это легко исправить: выделите колонку и смените формат ячеек на числовой, либо используйте функцию «Текст по столбцам», которая заодно приведёт значения к числам.
Иногда мешают лишние пробелы или разделители — их убирают через «Найти и заменить».
Так бывает с таблицами, где колонки разделены только пробелами, без явных границ: инструмент не всегда понимает, где заканчивается одна колонка и начинается другая. Решение простое — в Excel выделите проблемную колонку и примените «Текст по столбцам», указав разделитель (пробел или другой символ).
Данные разложатся по отдельным ячейкам, и таблицу можно будет использовать дальше.
В любой, что понимает формат Excel: Microsoft Excel, бесплатный LibreOffice Calc, WPS Spreadsheets, Google Таблицы, Numbers на Mac и мобильные редакторы таблиц. Файл сохраняется в стандартном .xlsx, поэтому проблем с совместимостью не будет.
Открыв его, вы сразу сможете сортировать, фильтровать данные, строить формулы и приводить таблицу в нужный вид.