Java IO流读取中文

一、使用FileInputStream 字节流正确读取中文
1. 必须了解文本是以哪种编码方式保存字符的
2. 使用字节流读取了文本后,再使用对应的编码方式去识别这些数字,得到正确的字符

  private static void inputStreamChina() {
		// TODO Auto-generated method stub
		File f=new File("D:/BugReport.txt");
		try (FileInputStream fis=new FileInputStream(f)){
			byte[] bytes=new byte[(int) f.length()];
			fis.read(bytes);
//			window记事本默认编码方式是gbk,如果保存文件以UTF-8保存,便以UTF-8读出
//			String str = new String(bytes,"GBK");
            String str = new String(bytes,"UTF-8");
            System.out.println(str);
		} catch (Exception e) {
			// TODO: handle exception
		}
	}

二、用FileReader 字符流正确读取中文
FileReader得到的是字符,所以一定是已经把字节根据某种编码识别成了字符了,
而FileReader使用的编码方式是Charset.defaultCharset()的返回值,如果是中文的操作系统,就是GBK
FileReader是不能手动设置编码方式的,为了使用其他的编码方式,只能使用InputStreamReader来代替

private static void FileReaderChina() {
//		使用默认编码方式读取
		File f=new File("D:/BugReport.txt");
		System.out.println("默认编码方式:"+Charset.defaultCharset());
		//FileReader得到的是字符,所以一定是已经把字节根据某种编码识别成了字符了
        //而FileReader使用的编码方式是Charset.defaultCharset()的返回值,如果是中文的操作系统,就是GBK
		try(FileReader fr=new FileReader(f)) {
			char[] chars=new char[(int) f.length()];
			fr.read(chars);
			System.out.printf("FileReader会使用默认的编码方式%s,识别出来的字符是:%n",Charset.defaultCharset());
			System.out.println(new String(chars));
		} catch (Exception e) {
			// TODO: handle exception
		}
//		使用指定编码方式读取
		//FileReader是不能手动设置编码方式的,为了使用其他的编码方式,只能使用InputStreamReader来代替
        //并且使用new InputStreamReader(new FileInputStream(f),Charset.forName("UTF-8")); 这样的形式
		try (InputStreamReader isr=new InputStreamReader(new FileInputStream(f)
				,Charset.forName("UTF-8"))){
			char[] chars=new char[(int) f.length()];
			isr.read(chars);
			System.out.println(new String(chars));
		} catch (Exception e) {
			// TODO: handle exception
		}
	}

版权声明:本文为qq_37133554原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。