IO流 一、文件的编码

String s="慕课ABC";

byte[] bytes1=s.getBytes();

//这是把字符串转换成字符数组,转换成的字节序列用的是项目默认的编码  

for(byte b: bytes1)

        System.out.println(Integer.toHexString(b & 0xff)+" ");//& 0xff是为了把前面的24个0去掉只留下后八位

//toHexString这个函数是把字节(转换成了Int)以16进制的方式显示

byte[] bytes1=s.getBytes("gbk");//也可以转换成指定的编码

  • gbk编码: 中文占用两个字节,英文占用一个字节
  • utf-8编码:中文占用三个字节,英文占用一个字节
  • java是双字节编码,是utf-16be编码
  • utf-16be编码:中文占用两个字节,英文占用两个字节

当你的字节序列是某种编码时,这个时候想把字节序列变成字符串,也需要用这种编码方式,否则会出现乱码

 

String str1=new String(bytes4);//这时会使用项目默认的编码来转换,可能出现乱码 要使用字节序列的编码来进行转换

String str2=new String(bytes4,"utf-16be");

文本文件就是字节序列,可以是任意编码的字节序列

如果我们在中文机器上直接创建文本文件,那么该文件只认识ANSI编码(例如直接在电脑中创建文本文件)