Add jstrings 0.6, japanese enhancement of strings(1) command.

PR: ports/70017 Submitted by: Ryo Okamoto
author: Volker Stolz <vs@FreeBSD.org> 2005-05-10 13:51:52 +0000
committer: Volker Stolz <vs@FreeBSD.org> 2005-05-10 13:51:52 +0000
commit: db145c66a9e70ae89b574bc28c755983775f7323 (patch)
tree: 0939d340e80a66813d75607f55210cdea2b7230b /japanese
parent: - Back to run as root by default and add options to change it (diff)
9 files changed, 261 insertions, 0 deletions
diff --git a/japanese/Makefile b/japanese/Makefile
index a7ce934f22d7..c129137f6246 100644
--- a/japanese/Makefile
+++ b/japanese/Makefile
@@ -126,6 +126,7 @@
     SUBDIR += jmode
     SUBDIR += jmode-skk
     SUBDIR += jpilot
+    SUBDIR += jstrings
     SUBDIR += jvim
     SUBDIR += jvim-canna
     SUBDIR += jvim-canna+freewnn
diff --git a/japanese/jstrings/Makefile b/japanese/jstrings/Makefile
new file mode 100644
index 000000000000..fd1109fcc3c7
--- /dev/null
+++ b/japanese/jstrings/Makefile
@@ -0,0 +1,46 @@
+# New ports collection makefile for:	jstrings
+# Date created:				29 July 2004
+# Whom:					ryo
+#
+# $FreeBSD$
+#
+
+PORTNAME=	jstrings
+PORTVERSION=	0.6
+CATEGORIES=	japanese
+MASTER_SITES=	http://openmya.hacker.jp/hasegawa/jstrings/ \
+		http://devel.aquahill.net/ports/jstrings/ \
+		http://www.kokone.to/~ryo/lib/ports/jstrings/
+DISTNAME=	${PORTNAME}-${PORTVERSION}
+EXTRACT_SUFX=	.lzh
+
+MAINTAINER=	ryo@aquahill.net
+COMMENT=	Japanese enhancement of strings(1) command
+
+EXTRACT_DEPENDS=lha:${PORTSDIR}/archivers/lha \
+		nkf:${PORTSDIR}/japanese/nkf
+
+MAN1=		jstrings.1
+MANLANG=	ja
+PLIST_FILES=	bin/jstrings
+
+EXTRACT_CMD=	lha
+EXTRACT_BEFORE_ARGS=	xfqw=${WRKDIR}
+
+USE_GMAKE=	yes
+MAKEFILE=	makefile.gcc
+MAKE_ARGS=	CC="${CC}" CFLAGS="${CFLAGS}" BINDIR="${PREFIX}/bin"
+ALL_TARGET=	jstrings
+
+post-extract:
+	@${ECHO_MSG} "===>  Converting Kanji code and deleting CR for ${DISTNAME}"
+	@(cd ${WRKSRC}; \
+	for i in *.c *.h *.txt makefile.* ; \
+	do \
+		nkf -de $$i > $$i.tmp && ${MV} $$i.tmp $$i; \
+	done)
+
+post-install:
+	${INSTALL_MAN} ${FILESDIR}/jstrings.1 ${PREFIX}/man/${MANLANG}/man1
+
+.include <bsd.port.mk>
diff --git a/japanese/jstrings/distinfo b/japanese/jstrings/distinfo
new file mode 100644
index 000000000000..f6ce99aa4d2d
--- /dev/null
+++ b/japanese/jstrings/distinfo
@@ -0,0 +1,2 @@
+MD5 (jstrings-0.6.lzh) = e283cdc91b9afff7fa91eb49fff41177
+SIZE (jstrings-0.6.lzh) = 84653
diff --git a/japanese/jstrings/files/jstrings.1 b/japanese/jstrings/files/jstrings.1
new file mode 100644
index 000000000000..ae38597ad12c
--- /dev/null
+++ b/japanese/jstrings/files/jstrings.1
@@ -0,0 +1,166 @@
+.TH jstrings  "July 29, 2004" "" ""
+.RS
+名前
+jstrings - ファイル中の表示可能な文字列(日本語を含む)を表示する。
+.PP
+書式
+jstrings [\fB-i\fP 文字コード] [\fB-n\fP 文字数|-文字数] [\fB-fpcts\fP] [ファイル名]
+.PP
+説明
+jstrings は指定されたファイル中に含まれる表示可能な文字列を表示する。
+文字列と認識できる文字コード(符号化方式)はオプションにより指定でき
+る。デフォルトでは4文字以上の長さのものを表示可能な文字列とするが、
+以下で説明するオプションにより変更することができる。
+.RS
+.PP
+ファイル名が指定されないときは標準入力を対象とする。
+.RE
+.PP
+オプション
+\fB-i\fP 文字コード
+ファイルに含まれるであろう文字列の文字コード(符号化方式)を指定
+する。現在指定可能な文字コードは以下の通り。
+.RS
+.PP
+ANSI_X3.4-1968
+.SS            ASCII
+.SS            US
+.TP
+.B
+US-ASCII
+ファイルに含まれる ASCII 文字列のみを対象とする。
+.PP
+Windows-31J
+CP932
+MS932
+ファイルに含まれる CP932 の文字列を対象とする。これは 
+Shift_JIS + いわゆる機種依存文字のことである。
+.PP
+Shift_JIS
+MS_Kanji
+ShiftJIS
+.SS            SJIS
+ファイルに含まれる Shift_JIS の文字列を対象とする。これには
+いわゆる「機種依存文字」は含まれない。
+.SS            EBCDIC
+ファイルに含まれる EBCDIC の文字列を対象とする。
+.RE
+.PP
+ISO-2022-JP
+ISO2022JP
+.SS            JIS
+ファイルに含まれる \fBISO-2022-JP\fP(を拡張したもの) の文字列を対
+象とする。詳細は後述の ISO-2022-JP の項を参照のこと。
+.RE
+.PP
+UTF-16
+UTF16
+ファイルに含まれる UTF-16 の文字列を対象とする。バイトオーダ
+マーク(BOM)を検出した時には、BOMに従いビッグエンディアンとリ
+トルエンディアンを切り替える。
+.RS
+.PP
+UTF-16LE
+UTF16LE
+ファイルに含まれる UTF-16LE の文字列を対象とする。バイトオー
+ダマーク(BOM)は読み捨てられる。
+.PP
+UTF-16BE
+UTF16BE
+ファイルに含まれる UTF-16BE の文字列を対象とする。バイトオー
+ダマーク(BOM)は読み捨てられる。
+.RE
+.PP
+\fB-n\fP 文字数
+-文字数
+指定された文字数以上の長さの文字列を表示する。指定は文字数
+単位であるためASCII文字に限らず漢字なども1文字と数えられる。
+デフォルトは4。
+.RS
+.PP
+\fB-f\fP
+それぞれの文字列の前にファイル名を表示する。
+.PP
+\fB-p\fP
+それぞれの文字列の前に文字列が見つかったファイル内での先頭
+からの位置を表示する。
+.PP
+\fB-c\fP
+それぞれの文字列の前にその文字列のコード名を表示する。
+.PP
+\fB-t\fP
+(可能であれば)標準出力をテキストモードで使用する。
+デフォルトはバイナリモードである。
+.PP
+\fB-s\fP
+文字列の先頭バイトがマルチバイト文字の先行バイトであった場
+合には、それを読み捨て、2バイト目以降から文字列が始まってい
+るものとする(Shift_JISおよびWindows-31Jでのみ有効)。
+.PP
+-?
+ヘルプメッセージを表示する。
+.RE
+.PP
+ISO-2022-JP
+\fB-i\fP オプションに ISO-2022-JP を指定したときには、RFC1468 で規定され
+る ISO-2022-JP を独自に拡張した文字列をファイルから検索する。この
+拡張は以下のとおり。
+.RS
+.IP 1) 4
+ESC 2/4 4/9 というエスケープシーケンスにより JIS X0201 仮名文字
+集合(いわゆる半角カタカナ)へ切り替える。
+.IP 2) 4
+CR LF により ASCII に切り替える。
+.PP
+また、エスケープシーケンスに続かない、文字集合の不明なバイト列は
+\fB-i\fP ISO-2022-JP:SUBCODE という形でその扱いを指定することにより特定
+の文字集合とみなすことができる。SUBCODE に指定できる値は以下のとお
+り。
+.SS        ASCII 
+文字集合が不明なバイト列を ASCII とみなす。
+X0201-ROMAN
+文字集合が不明なバイト列を JIS X0201 ラテン文字集合とみなす。
+X0208-1978
+文字集合が不明なバイト列を JIS X0208-1978 とみなす。
+X0208-1983
+X0208-1990
+文字集合が不明なバイト列を JIS X0208-1990 とみなす。
+X0201-KANA
+文字集合が不明なバイト列を JIS X0201 仮名文字集合とみなす。
+.SS        ALL
+文字集合が不明なバイト列を、上記の文字集合すべてに可能な限り
+当てはめる。
+.SS        IGNORE
+文字集合が不明なバイト列は無視して読み捨てる。
+.RE
+.PP
+例えば、\fB-i\fP ISO-2022-JP:ASCII と指定したときには、文字集合の判断
+がつかないバイト列は、ASCII文字列として扱われる。
+SUBCODE を省略した場合には IGNORE が指定されたものとみなす。
+.RS
+.PP
+バグ
+充分にテストされていないのでバグは多々あると思われる。
+.RS
+.PP
+ファイル内に含まれる文字列の長さが65535バイトを超えるときにはうま
+く表示できない。これは、vstr.c 内の MAX_BUF_SIZE 定数により制限さ
+れている。
+.PP
+EBCDIC を指定したときには \fB-f\fP \fB-p\fP \fB-c\fP で表示される情報は ASCII である
+ため、表示が乱れる。
+.PP
+UTF-16* で検出可能な文字集合はCP932と同一の範囲内のみである。
+.PP
+UTF-16* を指定したときには結果は常に BOM を先頭に付加したUTF-16BE
+で出力される。また、\fB-f\fP でファイル名を表示させた時に、ファイル名に
+非ASCII文字が含まれている場合、それは文字化けを引き起こす。
+.PP
+\fB-i\fP オプションは同時に複数指定することも可能であるが、その場合、表
+示は複数の文字コードが入り混じったものとなる。
+将来的には UTF-8 も対象とし、表示するために使用する文字コードも指
+定できるようにしたい。
+.RE
+.PP
+著者
+はせがわ ようすけ
diff --git a/japanese/jstrings/files/patch-remove-typo b/japanese/jstrings/files/patch-remove-typo
new file mode 100644
index 000000000000..c8108e2aa5da
--- /dev/null
+++ b/japanese/jstrings/files/patch-remove-typo
@@ -0,0 +1,10 @@
+--- utilstr.c.orig	Thu Aug  5 14:05:48 2004
++++ utilstr.c	Thu Aug  5 14:06:15 2004
+@@ -41,7 +41,6 @@
+ size_t my_strncpy( char *s, const char *t, size_t n )
+ {
+ 	size_t r = 0;
+-	char *s0 = s;
+ 
+ 	if( s == NULL || t == NULL || n == 0 )return 0;
+ 	n--;
diff --git a/japanese/jstrings/files/patch-string-cp932 b/japanese/jstrings/files/patch-string-cp932
new file mode 100644
index 000000000000..107f567a32a9
--- /dev/null
+++ b/japanese/jstrings/files/patch-string-cp932
@@ -0,0 +1,9 @@
+--- cp932.c.orig	Thu Aug  5 14:03:35 2004
++++ cp932.c	Thu Aug  5 14:04:07 2004
+@@ -1,6 +1,7 @@
+ #include	<stdio.h>
+ #include	<stddef.h>
+ #include	<stdlib.h>
++#include	<string.h>
+ #include	"jstrings.h"
+ #include	"cp932.h"
diff --git a/japanese/jstrings/files/patch-string-eucjp b/japanese/jstrings/files/patch-string-eucjp
new file mode 100644
index 000000000000..eedb5bdaa180
--- /dev/null
+++ b/japanese/jstrings/files/patch-string-eucjp
@@ -0,0 +1,8 @@
+--- eucjp.c.orig	Thu Aug  5 14:04:36 2004
++++ eucjp.c	Thu Aug  5 14:04:47 2004
+@@ -1,4 +1,5 @@
+ #include	<stdlib.h>
++#include	<string.h>
+ #include	"eucjp.h"
+ #include	"jstrings.h"
+ #include	"ascii.h"
diff --git a/japanese/jstrings/files/patch-utf8-off b/japanese/jstrings/files/patch-utf8-off
new file mode 100644
index 000000000000..bd900c330c2b
--- /dev/null
+++ b/japanese/jstrings/files/patch-utf8-off
@@ -0,0 +1,12 @@
+--- jstrings.c.orig	Thu Apr 28 20:21:41 2005
++++ jstrings.c	Thu Apr 28 20:22:01 2005
+@@ -50,7 +50,7 @@
+ 	{ NULL, open_utf16,	strings_utf16,	flush_utf16,	close_utf16,	0, NULL },	/* UTF-16 */
+ 	{ NULL, open_utf16le, strings_utf16le, flush_utf16le, close_utf16le,0, NULL },	/* UTF-16LE */
+ 	{ NULL, open_utf16be, strings_utf16be, flush_utf16be, close_utf16be,0, NULL },	/* UTF-16BE */
+-/*	{ NULL, open_utf8,	strings_utf8,	flush_utf8,		close_utf8,		0, NULL },	/* UTF-8 */
++/*	{ NULL, open_utf8,	strings_utf8,	flush_utf8,		close_utf8,		0, NULL },	*/	/* UTF-8 */
+ 	{ NULL, open_dummy, strings_dummy,	flush_dummy,	close_dummy,	0, NULL },	/* UTF-8 */
+ 	{ NULL, open_ebcdic,strings_ebcdic,	flush_ebcdic,	close_ebcdic,	0, NULL },	/* EBCDIC */
+ };
+
diff --git a/japanese/jstrings/pkg-descr b/japanese/jstrings/pkg-descr
new file mode 100644
index 000000000000..4731c00f36ea
--- /dev/null
+++ b/japanese/jstrings/pkg-descr
@@ -0,0 +1,7 @@
+Japanese enhancement of strings(1) command. You can extract
+2byte-charactors from binary files in various types of Japanese code.
+
+WWW: http://openmya.hacker.jp/hasegawa/
+
+- ryo
+ryo@aquahill.net
author	Volker Stolz <vs@FreeBSD.org>	2005-05-10 13:51:52 +0000
committer	Volker Stolz <vs@FreeBSD.org>	2005-05-10 13:51:52 +0000
commit	db145c66a9e70ae89b574bc28c755983775f7323 (patch)
tree	0939d340e80a66813d75607f55210cdea2b7230b /japanese
parent	- Back to run as root by default and add options to change it (diff)