Навчально-науковий інститут лісового і садово-паркового господарства

Штучний інтелект у підготовці наукових статей: коли краще утриматися

Генеративний штучний інтелект дедалі частіше застосовується при підготовці рукописів, проте правила провідних міжнародних видавництв у цій сфері ще остаточно не сформувалися. Дозволене застосування штучного інтелекту (ШІ) суттєво різниться залежно від журналу, типу використання та категорії матеріалу. За таких умов найбезпечніша стратегія не вдаватися до ШІ там, де немає повної впевненості, що конкретний сценарій прямо дозволений правилами саме того журналу, до якого подається рукопис. Розкриваючи проблематику цього питання варто на початку уточнити термінологію поняття «штучний інтелект», що є надто широке, збірне поняття, тоді як у правилах видавництв і в цьому тексті йдеться насамперед про його окремий підклас — генеративні моделі, які створюють новий контент. Для тексту це великі мовні моделі (ВММ), для зображень — генеративні (здебільшого дифузійні) моделі. Уживання загальної абревіатури «ШІ» там, де доречно назвати конкретний клас інструментів, не лише неточне, а й може ускладнити саме те декларування, якого вимагає журнал.

Сучасні системи генерації тексту — ChatGPT, Claude, Gemini та подібні є великими мовними моделями, побудованими на архітектурі «трансформер» (запропонованій 2017 року в роботі «Attention Is All You Need»). Її ключовий елемент це механізм уваги (attention), що дає змогу моделі зважувати зв'язки між усіма словами контексту. Модель навчена на великих текстових масивах генерує текст послідовно, щокроку передбачаючи найімовірніший наступний фрагмент (токен). Власне абревіатура GPT і розшифровується як generative pre-trained transformer. Звідси випливає головне для науковця обмеження: модель продукує статистично правдоподібний, а не перевірений на фактичність текст, тому можливі вигадані твердження та неіснуючі посилання (так звані галюцинації).

Генератори зображень (GPT Image 2, Nano Banana 2, Stable Diffusion) побудовані інакше, здебільшого це дифузійні моделі (раніше для цього застосовували й генеративно-змагальні мережі, GAN), які навчені поетапно усувати шум і будують зображення «з нуля», відштовхуючись від випадкового шуму та керуючись текстовим запитом. Такий інструмент синтезує правдоподібні пікселі, а не фіксує виміряну реальність — звідси анатомічно неможливі деталі та беззмістовні підписи, як у наведеному далі випадку Frontiers. Саме нез'ясованість походження та правового статусу згенерованих пікселів і робить їх проблемою авторського права й наукової доброчесності для видавництв.

Кілька обмежень є загальними для всіх провідних видавців (Elsevier, Springer Nature, Wiley, Taylor & Francis, MDPI, IEEE, PLOS та інших) а також закріплені в рекомендаціях COPE, ICMJE та WAME. ШІ не може бути зазначений як автор статті, відповідальність за зміст несуть виключно автори. Так само в усіх без винятку видавництвах заборонені будь-які маніпуляції з первинними даними: переміщення, видалення або приховування деталей на фотографіях, знімках дистанційного зондування Землі, рентгенівських або клінічних зображеннях.

Щодо тексту рукопису, базову перевірку граматики й орфографії більшість видавництв від декларування звільняє. Для всього іншого, зокрема суттєвого перефразування, генерації тексту, перекладу тощо, вимагається прозорий опис у рукописі: який інструмент, яка версія, для якого розділу та з якою метою він використовувався. Місце такого опису залежить від видавця: Springer Nature вимагає розкриття в розділі «Методи», Elsevier — в окремій декларації перед списком літератури, IEEE — у «Подяках», Wiley — у «Методах» або «Подяках» залежно від типу використання, MDPI — опис у «Матеріалах і методах» з реквізитами інструмента в «Подяках». Аналітичні скрипти і код (Python, R, Google Earth Engine) доцільно описувати в «Матеріалах і методах» нарівні з іншими дослідницькими інструментами.

Питання зображень потребує окремої уваги, оскільки підходи видавництв тут суттєво різняться залежно від функції, яку зображення виконує у статті. Якщо йдеться про пояснювальні схеми та діаграми (блок-схеми методології, структурні схеми, узагальнені діаграми процесів тощо) позиції видавництв розходяться. Частина з них допускає підготовку таких рисунків за допомогою ШІ за умови обов'язкового декларування назви та версії інструмента. Так чинять, зокрема, IEEE (з розкриттям у розділі «Подяки») та MDPI (опис використання — у «Матеріалах і методах», денеталі інструмента — у «Подяках»). Натомість Springer Nature, Elsevier, Taylor & Francis, Wiley та Science (AAAS) фактично забороняють ШІ-генерацію зображень навіть у цій категорії, передусім через невирішені питання авторського права на результати генеративних моделей та ризики для наукової доброчесності. При цьому Taylor & Francis трактує поняття «зображення» широко, відносячи сюди й діаграми, графіки, таблиці, фрагменти зображень, програмний код і формули, а Wiley допускає винятки лише з попереднього дозволу видавця. Якщо в правилах журналу немає прямого дозволу, схему краще підготувати без залучення ШІ.

Принципово інша ситуація коли ШІ є інструментом самого дослідження. Тут ідеться вже не про генеративні, а про дискримінативні (класифікаційні) моделі. Якщо нейронна мережа класифікує лісовий покрив на супутникових знімках, алгоритм машинного навчання виявляє захаращення після буреломів або сегментує крони дерев на даних лазерного сканування, такий підхід є загальноприйнятим і не підпадає під обмеження щодо ШІ. Вимога одна — детальний і відтворюваний опис методу у відповідному розділі рукопису із зазначенням назви моделі, версії, навчальної вибірки та параметрів.

Наслідки недотримання цих правил вже зустрічалися в світовій науковій спільноті. У лютому 2024 року журнал Frontiers in Cell and Developmental Biology відкликав статтю з ілюстраціями, згенерованими програмою Midjourney, які містили анатомічно безглуздий вміст і нечитабельні підписи. У квітні 2026 року New England Journal of Medicine відкликав опис клінічного випадку після того, як з'ясувалося, що автори за допомогою ШІ пересунули лінійку на медичному знімку. У випадку NEJM автори прямо послалися на незнання правил журналу щодо роботи із зображеннями; у Frontiers використання Midjourney було задеклароване, проте зображення не пройшли перевірки на достовірність. В обох випадках пояснення авторів не вберегли публікації від відкликання.

Про масштаб проблеми свідчать і дані багатьох досліджень. Kobak та ін. (Science Advances, 2 липня 2025), проаналізувавши 15,1 мільйона анотацій у базі PubMed за 2010–2024 роки, встановили, що щонайменше 13,5% анотацій 2024 року оброблено великими мовними моделями, а в окремих тематичних групах цей показник сягає 40%. Підвищений показник зафіксовано зокрема в журналах MDPI та Frontiers — платформах, поширених у лісовому та природоохоронному секторах. Автоматичні засоби виявлення ШІ-тексту при цьому залишаються ненадійними, особливо для авторів-неносіїв англійської мови, тому видавництва дедалі більше спираються не на них, а на пряму вимогу декларування від авторів.

З огляду на це, перед поданням рукопису передусім варто перевірити правила конкретного журналу, а не лише загальну позицію видавництва, адже вони можуть відрізнятися. Журнали з лісівництва та геоінформатики мають конкретні вказівки у своїх авторських інструкціях: Forest Ecology and Management, Remote Sensing of Environment, ISPRS Journal of Photogrammetry and Remote Sensing, Annals of Forest Science, Forests (MDPI), Canadian Journal of Forest Research. Зручно також вести короткий журнал використання ШІ під час роботи над рукописом, зазначаючи інструмент, версія, дата, розділ, мета тощо. Такий запис знадобиться, якщо редакція зробить відповідний запит. Якщо ж прямого дозволу на конкретний сценарій у правилах журналу не знайдено краще утриматися від використання ШІ або звернутися до редакції з уточнювальним запитом до подання.

Варто сказати й про практичний інструментарій, тим паче що значна його частина це вільне програмне забезпечення з відкритим кодом, доступне без ліцензійних витрат. Поза програмуванням на Python це насамперед середовище статистичних обчислень R з оболонкою RStudio (зокрема пакет ggplot2 для якісної графіки), геоінформаційна система QGIS для роботи з картами й дистанційними даними та Orange — платформа візуального аналізу даних і машинного навчання, що дає змогу будувати робочі процеси без програмування.

Якщо говорити саме про Python, варто згадати кілька перевірених бібліотек для візуалізації. Базові — matplotlib (повний контроль над рисунком) і seaborn (статистична графіка з охайними типовими налаштуваннями), для оформлення під стиль конкретного журналу зручний пакет SciencePlots, а для інтерактивних графіків — plotly. Для просторових і дистанційних даних, типових у лісовому господарстві, корисні GeoPandas (векторні шари), rasterio та rioxarray (растри й супутникові знімки), xarray (багатовимірні масиви), cartopy (картографічні проєкції), а також contextily чи leafmap (підкладкові карти та інтерактивні мапи).

Окремо варто наголосити, що за умови коли в дослідника вже є власний набір даних, велика мовна модель цілком очевидно допоможе написати й налагодити код для його обробки та побудови таких рисунків. Це продуктивний і малоризиковий сценарій на відміну від генерації тексту чи зображень, адже підсумкові графіки відображають реально виміряні дані, а не синтезовані моделлю. Як і будь-який дослідницький інструмент, таке використання ШІ доцільно стисло описати в «Матеріалах і методах» із зазначенням мови, ключових бібліотек і ролі моделі в підготовці коду.

Ще один крок у цьому напрямі — MCP (Model Context Protocol), відкритий стандарт, запропонований наприкінці 2024 року, який дає змогу мовній моделі під'єднуватися безпосередньо до зовнішніх програм, даних і сервісів через стандартизовані «сервери». Замість переносити код і дані вручну між чатом і робочим середовищем, модель отримує контрольований доступ до файлів, бази даних чи самого застосунку й може виконувати в них дії. Протокол є модельно-незалежним і відкритим, а сервери можуть працювати як з локальними моделями так і з відкритими вагами (наприклад, через Ollama).

Для лісівничих і геоінформаційних завдань уже є придатні до застосування приклади. Для QGIS існує MCP-інтеграція (QGIS MCP та варіант QGIS2OllamaMCP для локальних моделей), через яку модель створює проєкти, додає векторні й растрові шари, запускає алгоритми обробки та виконує код Python безпосередньо в ГІС. Для роботи з кодом і даними є сервери для Jupyter (виконання й ведення записників), для баз даних PostgreSQL/PostGIS та SQLite (прямі запити до просторових і табличних даних), а також базові офіційні сервери для файлової системи Git (розподілена система контролю версій). Але саме тому, що модель тут не лише радить, а діє (виконує код, змінює проєкти й файли) зростає відповідальність дослідника. Такі робочі процеси варто документувати в «Матеріалах і методах» (які інструменти та сервери залучено й що саме виконувала модель), працювати з копіями, а не з первинними даними, і перевіряти кожен результат.

Слід зазначити, що питання коректного використання ШІ в науковій комунікації також неодноразово обговорювалося в межах міжнародного проекту Erasmus+ ForestPost (GA 101179074), учасниками якого є НУБіП України, Трансільванський університет (Румунія), Університет Вальядоліда (Іспанія), HNEE Еберсвальде (Німеччина) та інші партнери.

ср, 3 чер 2026 - 09:12

Євгеній ХАНЬ,
заступник директора ННІ ЛіСПГ з міжнародної діяльності,

Олександр БАЛА,
координатор наукової роботи НДІ лісівництва та декоративного садівництва

Поділитися: