UTF-8 je zkratka pro UCS/Unicode Transformation Format. Je to způsob kódování řetězců znaků Unicode/ISO/IEC 10646 do sekvencí bajtů. Zatímco varianta UTF-16 kóduje řetězce do posloupností 16bitových slov (2 bajty) a varianta UTF-32 do 32 bitových slov (4 bajty), UTF-8 používá proměnnou délku znaku, od 1 do 4 (resp. 6) bajtů. Byl navržen pro zpětnou kompatibilitu s ASCII, se kterým tak má totožný způsob kódování 1-bajtových znaků.