Formato de codificación de caracteres que puede representar cualquier carácter en Unicode.
Es ampliamente utilizado en la web para manejar texto en múltiples idiomas.
// UTF-8 en HTML <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <!-- Declarar codificación --> </head> <body> <p>Español: ñ, á, é, í, ó, ú</p> <p>Japonés: 日本語</p> <p>Emoji: 👋 🎉 ✅</p> </body> </html> // UTF-8 en Node.js fs.writeFileSync('archivo.txt', 'Hola 世界', 'utf-8'); const contenido = fs.readFileSync('archivo.txt', 'utf-8'); // Base de datos // PostgreSQL CREATE DATABASE midb ENCODING 'UTF8'; // MySQL CREATE DATABASE midb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; // Bytes por carácter en UTF-8: // ASCII (a-z, 0-9): 1 byte // Latín extendido (ñ, á): 2 bytes // Caracteres asiáticos: 3 bytes // Emoji: 4 bytes // Longitud de string vs bytes const texto = '日本語'; console.log(texto.length); // 3 (caracteres) console.log(Buffer.byteLength(texto, 'utf-8')); // 9 (bytes)