DeepL APIを使ってWordPressの記事を翻訳後にHTMLタグを正規表現で補完する方法
WordPressの記事をDeepLのAPIを使用して翻訳した際に、HTMLタグが正しく認識されず、翻訳後に閉じタグが「<h3」のように表記されてしまうという事例が発生したため、その対処法です。
HTMLタグが正しく認識されない場合の解決方法
以下のように正規表現を用いて閉じタグが不完全な部分を補完します。
preg_replace('#</([^>]*)(?![a-z0-9])(?!>)#', '</$1>', '[不完全なhtmlタグを含む文字列]');
