При индексации очередных данных через xmlpipe2 поисковый движок sphinxsearch (Sphinx) начал ругаться про "XML parse error: not well-formed". Работать с не до конца сформированными индексами он тоже отказался.
Вдобавок и место ошибки указывает как-то странно: номер строки и идентификатор документа ведут в разные места индексируемого файла xml (в конечном итоге оказалось, что правильнее ориентироваться на идентификатор документа).
Вырезание кусков из xml файла сдвигало место ошибки.