Вход

~~3JIO~~

Объяснять не буду кто знает что это поймёт!
Да это приват разработка но всё же нельзя же всё таить на свн!

Unicode Reader

Добавлено через 1 минуту
если помог тыкаем +

Ro_0TT · 05-28-2011, 11:18 PM

3JIO Написал:Объяснять не буду кто знает что это поймёт!
Да это приват разработка но всё же нельзя же всё таить на свн!

Unicode Reader

package l2p.util;

import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.PushbackInputStream;
import java.io.Reader;

/**
* Generic unicode textreader, which will use BOM mark
* to identify the encoding to be used. If BOM is not found
* then use a given default encoding.
* System default is used if:
* BOM mark is not found and defaultEnc is NULL
*
* Usage pattern:
String defaultEnc = "ISO-8859-1"; // or NULL to use system default
FileInputStream fis = new FileInputStream(file);
Reader in = new UnicodeReader(fis, defaultEnc);
*/
public class UnicodeReader extends Reader
{
PushbackInputStream internalIn;
InputStreamReader internalIn2 = null;
String defaultEnc;

private static final int BOM_SIZE = 4;

UnicodeReader(InputStream in, String defaultEnc)
{
internalIn = new PushbackInputStream(in, BOM_SIZE);
this.defaultEnc = defaultEnc;
}

public String getDefaultEncoding()
{
return defaultEnc;
}

public String getEncoding()
{
if(internalIn2 == null)
return null;
return internalIn2.getEncoding();
}

/**
* Read-ahead four bytes and check for BOM marks. Extra bytes are
* unread back to the stream, only BOM bytes are skipped.
*/
protected void init() throws IOException
{
if(internalIn2 != null)
return;

String encoding;
byte bom[] = new byte[BOM_SIZE];
int n, unread;
n = internalIn.read(bom, 0, bom.length);

if(bom[0] == (byte) 0xEF && bom[1] == (byte) 0xBB && bom[2] == (byte) 0xBF)
{
encoding = "UTF-8";
unread = n - 3;
}
else if(bom[0] == (byte) 0xFE && bom[1] == (byte) 0xFF)
{
encoding = "UTF-16BE";
unread = n - 2;
}
else if(bom[0] == (byte) 0xFF && bom[1] == (byte) 0xFE)
{
encoding = "UTF-16LE";
unread = n - 2;
}
else if(bom[0] == (byte) 0x00 && bom[1] == (byte) 0x00 && bom[2] == (byte) 0xFE && bom[3] == (byte) 0xFF)
{
encoding = "UTF-32BE";
unread = n - 4;
}
else if(bom[0] == (byte) 0xFF && bom[1] == (byte) 0xFE && bom[2] == (byte) 0x00 && bom[3] == (byte) 0x00)
{
encoding = "UTF-32LE";
unread = n - 4;
}
else
{
// Unicode BOM mark not found, unread all bytes
encoding = defaultEnc;
unread = n;
}
// System.out.println("read=" + n + ", unread=" + unread);

if(unread > 0)
internalIn.unread(bom, (n - unread), unread);

// Use given encoding
if(encoding == null)
internalIn2 = new InputStreamReader(internalIn);
else
internalIn2 = new InputStreamReader(internalIn, encoding);
}

@Override
public void close() throws IOException
{
init();
internalIn2.close();
}

@Override
public int read(char[] cbuf, int off, int len) throws IOException
{
init();
return internalIn2.read(cbuf, off, len);
}

}

Добавлено через 1 минуту
если помог тыкаем +

:obamafacepalm: чем она "приватная"?

~~3JIO~~ · 05-28-2011, 11:22 PM

Ro0TT Написал::obamafacepalm: чем она "приватная"?

тем что в шаре такого скрипты небыло ещё

Ro_0TT · 05-28-2011, 11:27 PM

3JIO Написал:тем что в шаре такого скрипты небыло ещё

Извеняюсь за свои оффтопы, но блин.. убиваю такие личности.

3JIO, я тебе дал ссылку на "шару", да я почти уверен, что этот скрипт делали для шары, а под любую сборку его переносить.... добавить строку с пакейджем.. :killed:

Хочешь, общее признание? Хочешь славы и денег? Сделай что-нибудь свое, что-нибудь полезное обществу и выложи.... Незачем заниматься копипастом, да еще со словами "кто - знает, тот поймет".:compkill:

~~3JIO~~

забыл написать! данный скрипт был написан человеком с ником Ronn
этот человек работает с команде сср

Добавлено через 1 минуту
что тебе своё выложить??
белефа под феню или ещё чтот по круче??

Ro_0TT · 05-28-2011, 11:30 PM

3JIO Написал:забыл написать! данный скрипт был написан человеком с ником Ronn
этот человек работает с команде сср

Добавлено через 1 минуту
что тебе своё выложить??
белефа под феню или ещё чтот по круче??

оффтоп

~~3JIO~~ · 05-28-2011, 11:31 PM

Ro0TT Написал:

оффтоп

Подгрузку геодаты в инстанс.. :negodue:

сори но у меня этого нет!
я этого не делал
и врятли сделаю
потому что моих знаний пока не хватит для написание такого скрипта

krisadr

а что это такое? поддержка кириллицы в ядро?

Добавлено через 1 минуту
а нет все понял, три первых байта игнорирует

Aquanox · 05-30-2011, 12:31 PM

krisadr Написал:а что это такое? поддержка кириллицы в ядро?

Добавлено через 1 минуту
а нет все понял, три первых байта игнорирует

Достаточно распространенный класс. Это Reader который выбирает кодировку анализируя BOM (Byte Order Mark). Полезен когда имеешь дело с большим количеством файлов с разным типом юникода.

Код:
http://www.unicode.org/unicode/faq/utf_bom.html

 BOMs:

   00 00 FE FF    = UTF-32, big-endian

   FF FE 00 00    = UTF-32, little-endian

   EF BB BF       = UTF-8,

   FE FF          = UTF-16, big-endian

   FF FE          = UTF-16, little-endian

Оригинальный код можно найти и тут: http://koti.mbnet.fi/akini/java/unicoder...m.java.txt

Вход
Имя пользователя:
Пароль:	Забыли пароль?
	Запомнить меня

Возможно похожие темы ...
Тема		Автор	Ответы	Просмотры	Последний пост
	Unicode	SpeedFaer	1	2,781	03-05-2009, 05:35 PM Последний пост: Aquanox