Bash-4.2 distribution sources and documentation

2011-11-22 19:11:26 -05:00 · 2011-11-22 19:11:26 -05:00 · 495aee441b
commit 495aee441b
parent 30d188c293
341 changed files with 108751 additions and 36060 deletions
--- a/lib/glob/Makefile.in
+++ b/lib/glob/Makefile.in
@ -71,7 +71,7 @@ CSOURCES = $(srcdir)/glob.c $(srcdir)/strmatch.c $(srcdir)/smatch.c \
 # The header files for this library.
 HSOURCES = $(srcdir)/strmatch.h

-OBJECTS = glob.o strmatch.o smatch.o xmbsrtowcs.o
+OBJECTS = glob.o strmatch.o smatch.o xmbsrtowcs.o gmisc.o

 # The texinfo files which document this library.
 DOCSOURCE = doc/glob.texi
@ -119,6 +119,9 @@ realclean distclean maintainer-clean: clean
 mostlyclean: clean
 	-( cd doc && $(MAKE) $(MFLAGS) $@ )

+${BUILD_DIR}/pathnames.h: ${BUILD_DIR}/config.h ${BUILD_DIR}/Makefile Makefile
+	-( cd ${BUILD_DIR} && ${MAKE} ${MFLAGS} pathnames.h )
+
 ######################################################################
 #								     #
 #  Dependencies for the object files which make up this library.     #
@ -137,18 +140,24 @@ strmatch.o: $(BUILD_DIR)/config.h
 strmatch.o: $(BASHINCDIR)/stdc.h

 glob.o: $(BUILD_DIR)/config.h
+glob.o: $(topdir)/shell.h $(BUILD_DIR)/pathnames.h
 glob.o: $(topdir)/bashtypes.h $(BASHINCDIR)/ansi_stdlib.h $(topdir)/bashansi.h
 glob.o: $(BASHINCDIR)/posixstat.h $(BASHINCDIR)/memalloc.h
 glob.o: strmatch.h glob.h
 glob.o: $(BASHINCDIR)/shmbutil.h
 glob.o: $(topdir)/xmalloc.h

+gmisc.o: $(BUILD_DIR)/config.h
+gmisc.o: $(topdir)/bashtypes.h $(BASHINCDIR)/ansi_stdlib.h $(topdir)/bashansi.h
+gmisc.o: $(BASHINCDIR)/shmbutil.h
+
 xmbsrtowcs.o: ${BUILD_DIR}/config.h
 xmbsrtowcs.o: ${topdir}/bashansi.h ${BASHINCDIR}/ansi_stdlib.h
 xmbsrtowcs.o: ${BASHINCDIR}/shmbutil.h

 # Rules for deficient makes, like SunOS and Solaris
 glob.o: glob.c
+gmisc.o: gmisc.c
 strmatch.o: strmatch.c
 smatch.o: smatch.c
 xmbsrtowcs.o: xmbsrtowcs.c
--- a/lib/glob/gmisc.c
+++ b/lib/glob/gmisc.c
@ -0,0 +1,314 @@
+/* gmisc.c -- miscellaneous pattern matching utility functions for Bash.
+
+   Copyright (C) 2010 Free Software Foundation, Inc.
+
+   This file is part of GNU Bash, the Bourne-Again SHell.
+   
+   Bash is free software: you can redistribute it and/or modify
+   it under the terms of the GNU General Public License as published by
+   the Free Software Foundation, either version 3 of the License, or
+   (at your option) any later version.
+
+   Bash is distributed in the hope that it will be useful,
+   but WITHOUT ANY WARRANTY; without even the implied warranty of
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+   GNU General Public License for more details.
+
+   You should have received a copy of the GNU General Public License
+   along with Bash.  If not, see <http://www.gnu.org/licenses/>.
+*/
+
+#include <config.h>
+
+#include "bashtypes.h"
+
+#if defined (HAVE_UNISTD_H)
+#  include <unistd.h>
+#endif
+
+#include "bashansi.h"
+#include "shmbutil.h"
+
+#include "stdc.h"
+
+#ifndef LPAREN
+#  define LPAREN '('
+#endif
+#ifndef RPAREN
+#  define RPAREN ')'
+#endif
+
+#if defined (HANDLE_MULTIBYTE)
+#define WLPAREN         L'('
+#define WRPAREN         L')'
+
+/* Return 1 of the first character of WSTRING could match the first
+   character of pattern WPAT.  Wide character version. */
+int
+match_pattern_wchar (wpat, wstring)
+     wchar_t *wpat, *wstring;
+{
+  wchar_t wc;
+
+  if (*wstring == 0)
+    return (0);
+
+  switch (wc = *wpat++)
+    {
+    default:
+      return (*wstring == wc);
+    case L'\\':
+      return (*wstring == *wpat);
+    case L'?':
+      return (*wpat == WLPAREN ? 1 : (*wstring != L'\0'));
+    case L'*':
+      return (1);
+    case L'+':
+    case L'!':
+    case L'@':
+      return (*wpat == WLPAREN ? 1 : (*wstring == wc));
+    case L'[':
+      return (*wstring != L'\0');
+    }
+}
+
+int
+wmatchlen (wpat, wmax)
+     wchar_t *wpat;
+     size_t wmax;
+{
+  wchar_t wc, *wbrack;
+  int matlen, t, in_cclass, in_collsym, in_equiv;
+
+  if (*wpat == 0)
+    return (0);
+
+  matlen = in_cclass = in_collsym = in_equiv = 0;
+  while (wc = *wpat++)
+    {
+      switch (wc)
+	{
+	default:
+	  matlen++;
+	  break;
+	case L'\\':
+	  if (*wpat == 0)
+	    return ++matlen;
+	  else
+	    {
+	      matlen++;
+	      wpat++;
+	    }
+	  break;
+	case L'?':
+	  if (*wpat == WLPAREN)
+	    return (matlen = -1);		/* XXX for now */
+	  else
+	    matlen++;
+	  break;
+	case L'*':
+	  return (matlen = -1);
+	case L'+':
+	case L'!':
+	case L'@':
+	  if (*wpat == WLPAREN)
+	    return (matlen = -1);		/* XXX for now */
+	  else
+	    matlen++;
+	  break;
+	case L'[':
+	  /* scan for ending `]', skipping over embedded [:...:] */
+	  wbrack = wpat;
+	  wc = *wpat++;
+	  do
+	    {
+	      if (wc == 0)
+		{
+	          matlen += wpat - wbrack - 1;	/* incremented below */
+	          break;
+	        }
+	      else if (wc == L'\\')
+		{
+		  wc = *wpat++;
+		  if (*wpat == 0)
+		    break;
+		}
+	      else if (wc == L'[' && *wpat == L':')	/* character class */
+		{
+		  wpat++;
+		  in_cclass = 1;
+		}
+	      else if (in_cclass && wc == L':' && *wpat == L']')
+		{
+		  wpat++;
+		  in_cclass = 0;
+		}
+	      else if (wc == L'[' && *wpat == L'.')	/* collating symbol */
+		{
+		  wpat++;
+		  if (*wpat == L']')	/* right bracket can appear as collating symbol */
+		    wpat++;
+		  in_collsym = 1;
+		}
+	      else if (in_collsym && wc == L'.' && *wpat == L']')
+		{
+		  wpat++;
+		  in_collsym = 0;
+		}
+	      else if (wc == L'[' && *wpat == L'=')	/* equivalence class */
+		{
+		  wpat++;
+		  if (*wpat == L']')	/* right bracket can appear as equivalence class */
+		    wpat++;
+		  in_equiv = 1;
+		}
+	      else if (in_equiv && wc == L'=' && *wpat == L']')
+		{
+		  wpat++;
+		  in_equiv = 0;
+		}
+	    }
+	  while ((wc = *wpat++) != L']');
+	  matlen++;		/* bracket expression can only match one char */
+	  break;
+	}
+    }
+
+  return matlen;
+}
+#endif
+
+/* Return 1 of the first character of STRING could match the first
+   character of pattern PAT.  Used to avoid n2 calls to strmatch(). */
+int
+match_pattern_char (pat, string)
+     char *pat, *string;
+{
+  char c;
+
+  if (*string == 0)
+    return (0);
+
+  switch (c = *pat++)
+    {
+    default:
+      return (*string == c);
+    case '\\':
+      return (*string == *pat);
+    case '?':
+      return (*pat == LPAREN ? 1 : (*string != '\0'));
+    case '*':
+      return (1);
+    case '+':
+    case '!':
+    case '@':
+      return (*pat == LPAREN ? 1 : (*string == c));
+    case '[':
+      return (*string != '\0');
+    }
+}
+
+int
+umatchlen (pat, max)
+     char *pat;
+     size_t max;
+{
+  char c, *brack;
+  int matlen, t, in_cclass, in_collsym, in_equiv;
+
+  if (*pat == 0)
+    return (0);
+
+  matlen = in_cclass = in_collsym = in_equiv = 0;
+  while (c = *pat++)
+    {
+      switch (c)
+	{
+	default:
+	  matlen++;
+	  break;
+	case '\\':
+	  if (*pat == 0)
+	    return ++matlen;
+	  else
+	    {
+	      matlen++;
+	      pat++;
+	    }
+	  break;
+	case '?':
+	  if (*pat == LPAREN)
+	    return (matlen = -1);		/* XXX for now */
+	  else
+	    matlen++;
+	  break;
+	case '*':
+	  return (matlen = -1);
+	case '+':
+	case '!':
+	case '@':
+	  if (*pat == LPAREN)
+	    return (matlen = -1);		/* XXX for now */
+	  else
+	    matlen++;
+	  break;
+	case '[':
+	  /* scan for ending `]', skipping over embedded [:...:] */
+	  brack = pat;
+	  c = *pat++;
+	  do
+	    {
+	      if (c == 0)
+		{
+	          matlen += pat - brack - 1;	/* incremented below */
+	          break;
+	        }
+	      else if (c == '\\')
+		{
+		  c = *pat++;
+		  if (*pat == 0)
+		    break;
+		}
+	      else if (c == '[' && *pat == ':')	/* character class */
+		{
+		  pat++;
+		  in_cclass = 1;
+		}
+	      else if (in_cclass && c == ':' && *pat == ']')
+		{
+		  pat++;
+		  in_cclass = 0;
+		}
+	      else if (c == '[' && *pat == '.')	/* collating symbol */
+		{
+		  pat++;
+		  if (*pat == ']')	/* right bracket can appear as collating symbol */
+		    pat++;
+		  in_collsym = 1;
+		}
+	      else if (in_collsym && c == '.' && *pat == ']')
+		{
+		  pat++;
+		  in_collsym = 0;
+		}
+	      else if (c == '[' && *pat == '=')	/* equivalence class */
+		{
+		  pat++;
+		  if (*pat == ']')	/* right bracket can appear as equivalence class */
+		    pat++;
+		  in_equiv = 1;
+		}
+	      else if (in_equiv && c == '=' && *pat == ']')
+		{
+		  pat++;
+		  in_equiv = 0;
+		}
+	    }
+	  while ((c = *pat++) != ']');
+	  matlen++;		/* bracket expression can only match one char */
+	  break;
+	}
+    }
+
+  return matlen;
+}
--- a/lib/glob/smatch.c
+++ b/lib/glob/smatch.c
@ -1,7 +1,7 @@
 /* strmatch.c -- ksh-like extended pattern matching for the shell and filename
 		globbing. */

-/* Copyright (C) 1991-2005 Free Software Foundation, Inc.
+/* Copyright (C) 1991-2011 Free Software Foundation, Inc.

   This file is part of GNU Bash, the Bourne Again SHell.
   
@ -241,6 +241,8 @@ is_cclass (c, name)
 #  define STREQ(s1, s2) ((wcscmp (s1, s2) == 0))
 #  define STREQN(a, b, n) ((a)[0] == (b)[0] && wcsncmp(a, b, n) == 0)

+extern char *mbsmbchar __P((const char *));
+
 static int
 rangecmp_wc (c1, c2)
     wint_t c1, c2;
@ -314,7 +316,7 @@ is_wcclass (wc, name)

  memset (&state, '\0', sizeof (mbstate_t));
  mbs = (char *) malloc (wcslen(name) * MB_CUR_MAX + 1);
-  mbslength = wcsrtombs(mbs, (const wchar_t **)&name, (wcslen(name) * MB_CUR_MAX + 1), &state);
+  mbslength = wcsrtombs (mbs, (const wchar_t **)&name, (wcslen(name) * MB_CUR_MAX + 1), &state);

  if (mbslength == (size_t)-1 || mbslength == (size_t)-2)
    {
@ -365,6 +367,16 @@ xstrmatch (pattern, string, flags)
  int ret;
  size_t n;
  wchar_t *wpattern, *wstring;
+  size_t plen, slen, mplen, mslen;
+
+#if 0
+  plen = strlen (pattern);
+  mplen = mbstrlen (pattern);
+  if (plen == mplen && strlen (string) == mbstrlen (string))
+#else
+  if (mbsmbchar (string) == 0 && mbsmbchar (pattern) == 0)
+#endif
+    return (internal_strmatch ((unsigned char *)pattern, (unsigned char *)string, flags));

  if (MB_CUR_MAX == 1)
    return (internal_strmatch ((unsigned char *)pattern, (unsigned char *)string, flags));
--- a/lib/glob/xmbsrtowcs.c
+++ b/lib/glob/xmbsrtowcs.c
@ -1,6 +1,6 @@
 /* xmbsrtowcs.c -- replacement function for mbsrtowcs */

-/* Copyright (C) 2002-2004 Free Software Foundation, Inc.
+/* Copyright (C) 2002-2010 Free Software Foundation, Inc.

   This file is part of GNU Bash, the Bourne Again SHell.

@ -18,6 +18,12 @@
   along with Bash.  If not, see <http://www.gnu.org/licenses/>.
 */

+/* Ask for GNU extensions to get extern declaration for mbsnrtowcs if
+   available via glibc. */
+#ifndef _GNU_SOURCE
+#  define _GNU_SOURCE 1
+#endif
+
 #include <config.h>

 #include <bashansi.h>
@ -32,6 +38,11 @@
 #ifndef FREE
 #  define FREE(x)	do { if (x) free (x); } while (0)
 #endif
+
+#if ! HAVE_STRCHRNUL
+extern char *strchrnul __P((const char *, int));
+#endif
+
 /* On some locales (ex. ja_JP.sjis), mbsrtowc doesn't convert 0x5c to U<0x5c>.
   So, this function is made for converting 0x5c to U<0x5c>. */

@ -120,6 +131,94 @@ xmbsrtowcs (dest, src, len, pstate)
    return (wclength);
 }

+#if HAVE_MBSNRTOWCS
+/* Convert a multibyte string to a wide character string. Memory for the
+   new wide character string is obtained with malloc.
+
+   Fast multiple-character version of xdupmbstowcs used when the indices are
+   not required and mbsnrtowcs is available. */
+
+static size_t
+xdupmbstowcs2 (destp, src)
+    wchar_t **destp;	/* Store the pointer to the wide character string */
+    const char *src;	/* Multibyte character string */
+{
+  const char *p;	/* Conversion start position of src */
+  wchar_t *wsbuf;	/* Buffer for wide characters. */
+  size_t wsbuf_size;	/* Size of WSBUF */
+  size_t wcnum;		/* Number of wide characters in WSBUF */
+  mbstate_t state;	/* Conversion State */
+  size_t wcslength;	/* Number of wide characters produced by the conversion. */
+  const char *end_or_backslash;
+  size_t nms;	/* Number of multibyte characters to convert at one time. */
+  mbstate_t tmp_state;
+  const char *tmp_p;
+
+  memset (&state, '\0', sizeof(mbstate_t));
+
+  wsbuf_size = 0;
+  wsbuf = NULL;
+
+  p = src;
+  wcnum = 0;
+  do
+    {
+      end_or_backslash = strchrnul(p, '\\');
+      nms = (end_or_backslash - p);
+      if (*end_or_backslash == '\0')
+	nms++;
+
+      /* Compute the number of produced wide-characters. */
+      tmp_p = p;
+      tmp_state = state;
+      wcslength = mbsnrtowcs(NULL, &tmp_p, nms, 0, &tmp_state);
+
+      /* Conversion failed. */
+      if (wcslength == (size_t)-1)
+	{
+	  free (wsbuf);
+	  *destp = NULL;
+	  return (size_t)-1;
+	}
+
+      /* Resize the buffer if it is not large enough. */
+      if (wsbuf_size < wcnum+wcslength+1)	/* 1 for the L'\0' or the potential L'\\' */
+	{
+	  wchar_t *wstmp;
+
+	  wsbuf_size = wcnum+wcslength+1;	/* 1 for the L'\0' or the potential L'\\' */
+
+	  wstmp = (wchar_t *) realloc (wsbuf, wsbuf_size * sizeof (wchar_t));
+	  if (wstmp == NULL)
+	    {
+	      free (wsbuf);
+	      *destp = NULL;
+	      return (size_t)-1;
+	    }
+	  wsbuf = wstmp;
+	}
+
+      /* Perform the conversion. This is assumed to return 'wcslength'.
+       * It may set 'p' to NULL. */
+      mbsnrtowcs(wsbuf+wcnum, &p, nms, wsbuf_size-wcnum, &state);
+
+      wcnum += wcslength;
+
+      if (mbsinit (&state) && (p != NULL) && (*p == '\\'))
+	{
+	  wsbuf[wcnum++] = L'\\';
+	  p++;
+	}
+    }
+  while (p != NULL);
+
+  *destp = wsbuf;
+
+  /* Return the length of the wide character string, not including `\0'. */
+  return wcnum;
+}
+#endif /* HAVE_MBSNRTOWCS */
+
 /* Convert a multibyte string to a wide character string. Memory for the
   new wide character string is obtained with malloc.

@ -155,6 +254,11 @@ xdupmbstowcs (destp, indicesp, src)
      return (size_t)-1;
    }

+#if HAVE_MBSNRTOWCS
+  if (indicesp == NULL)
+    return (xdupmbstowcs2 (destp, src));
+#endif
+
  memset (&state, '\0', sizeof(mbstate_t));
  wsbuf_size = WSBUF_INC;