Blame SOURCES/expat-2.1.0-CVE-2016-0718.patch

3032c4
3032c4
Patch as described below, plus a12e78cb1b290e26a2b669eff3664d76bb73a408.
3032c4
3032c4
>From cdfcb1b5c95e93b00ae9e9d25708b4a3bee72c15 Mon Sep 17 00:00:00 2001
3032c4
From: Sebastian Pipping <sebastian@pipping.org>
3032c4
Date: Mon, 2 May 2016 00:02:44 +0200
3032c4
Subject: [PATCH] Address CVE-2016-0718 (/patch/ version 2.2.1)
3032c4
3032c4
* Out of bounds memory access when doing text conversion on malformed input
3032c4
* Integer overflow related to memory allocation
3032c4
3032c4
Reported by Gustavo Grieco
3032c4
3032c4
Patch credits go to
3032c4
* Christian Heimes
3032c4
* Karl Waclawek
3032c4
* Gustavo Grieco
3032c4
* Sebastian Pipping
3032c4
* Pascal Cuoq
3032c4
---
3032c4
 expat/lib/xmlparse.c    |  34 +++++++++-----
3032c4
 expat/lib/xmltok.c      | 115 +++++++++++++++++++++++++++++++++++-------------
3032c4
 expat/lib/xmltok.h      |  10 ++++-
3032c4
 expat/lib/xmltok_impl.c |  62 +++++++++++++-------------
3032c4
 4 files changed, 146 insertions(+), 75 deletions(-)
3032c4
3032c4
diff --git a/expat/lib/xmlparse.c b/expat/lib/xmlparse.c
3032c4
index e308c79..13e080d 100644
3032c4
diff -uap expat-2.1.0/lib/xmlparse.c.cve0718 expat-2.1.0/lib/xmlparse.c
3032c4
--- expat-2.1.0/lib/xmlparse.c.cve0718
3032c4
+++ expat-2.1.0/lib/xmlparse.c
3032c4
@@ -2415,11 +2415,11 @@
3032c4
           for (;;) {
3032c4
             int bufSize;
3032c4
             int convLen;
3032c4
-            XmlConvert(enc,
3032c4
+            const enum XML_Convert_Result convert_res = XmlConvert(enc,
3032c4
                        &fromPtr, rawNameEnd,
3032c4
                        (ICHAR **)&toPtr, (ICHAR *)tag->bufEnd - 1);
3032c4
             convLen = (int)(toPtr - (XML_Char *)tag->buf);
3032c4
-            if (fromPtr == rawNameEnd) {
3032c4
+            if ((convert_res == XML_CONVERT_COMPLETED) || (convert_res == XML_CONVERT_INPUT_INCOMPLETE)) {
3032c4
               tag->name.strLen = convLen;
3032c4
               break;
3032c4
             }
3032c4
@@ -2640,11 +2640,11 @@
3032c4
           if (MUST_CONVERT(enc, s)) {
3032c4
             for (;;) {
3032c4
               ICHAR *dataPtr = (ICHAR *)dataBuf;
3032c4
-              XmlConvert(enc, &s, next, &dataPtr, (ICHAR *)dataBufEnd);
3032c4
+              const enum XML_Convert_Result convert_res = XmlConvert(enc, &s, next, &dataPtr, (ICHAR *)dataBufEnd);
3032c4
               *eventEndPP = s;
3032c4
               charDataHandler(handlerArg, dataBuf,
3032c4
                               (int)(dataPtr - (ICHAR *)dataBuf));
3032c4
-              if (s == next)
3032c4
+              if ((convert_res == XML_CONVERT_COMPLETED) || (convert_res == XML_CONVERT_INPUT_INCOMPLETE))
3032c4
                 break;
3032c4
               *eventPP = s;
3032c4
             }
3032c4
@@ -3248,11 +3248,11 @@
3032c4
           if (MUST_CONVERT(enc, s)) {
3032c4
             for (;;) {
3032c4
               ICHAR *dataPtr = (ICHAR *)dataBuf;
3032c4
-              XmlConvert(enc, &s, next, &dataPtr, (ICHAR *)dataBufEnd);
3032c4
+              const enum XML_Convert_Result convert_res = XmlConvert(enc, &s, next, &dataPtr, (ICHAR *)dataBufEnd);
3032c4
               *eventEndPP = next;
3032c4
               charDataHandler(handlerArg, dataBuf,
3032c4
                               (int)(dataPtr - (ICHAR *)dataBuf));
3032c4
-              if (s == next)
3032c4
+              if ((convert_res == XML_CONVERT_COMPLETED) || (convert_res == XML_CONVERT_INPUT_INCOMPLETE))
3032c4
                 break;
3032c4
               *eventPP = s;
3032c4
             }
3032c4
@@ -5329,6 +5329,7 @@
3032c4
               const char *s, const char *end)
3032c4
 {
3032c4
   if (MUST_CONVERT(enc, s)) {
3032c4
+    enum XML_Convert_Result convert_res;
3032c4
     const char **eventPP;
3032c4
     const char **eventEndPP;
3032c4
     if (enc == encoding) {
3032c4
@@ -5341,11 +5342,11 @@
3032c4
     }
3032c4
     do {
3032c4
       ICHAR *dataPtr = (ICHAR *)dataBuf;
3032c4
-      XmlConvert(enc, &s, end, &dataPtr, (ICHAR *)dataBufEnd);
3032c4
+      convert_res = XmlConvert(enc, &s, end, &dataPtr, (ICHAR *)dataBufEnd);
3032c4
       *eventEndPP = s;
3032c4
       defaultHandler(handlerArg, dataBuf, (int)(dataPtr - (ICHAR *)dataBuf));
3032c4
       *eventPP = s;
3032c4
-    } while (s != end);
3032c4
+    } while ((convert_res != XML_CONVERT_COMPLETED) && (convert_res != XML_CONVERT_INPUT_INCOMPLETE));
3032c4
   }
3032c4
   else
3032c4
     defaultHandler(handlerArg, (XML_Char *)s, (int)((XML_Char *)end - (XML_Char *)s));
3032c4
@@ -6148,8 +6149,8 @@
3032c4
   if (!pool->ptr && !poolGrow(pool))
3032c4
     return NULL;
3032c4
   for (;;) {
3032c4
-    XmlConvert(enc, &ptr, end, (ICHAR **)&(pool->ptr), (ICHAR *)pool->end);
3032c4
-    if (ptr == end)
3032c4
+    const enum XML_Convert_Result convert_res = XmlConvert(enc, &ptr, end, (ICHAR **)&(pool->ptr), (ICHAR *)pool->end);
3032c4
+    if ((convert_res == XML_CONVERT_COMPLETED) || (convert_res == XML_CONVERT_INPUT_INCOMPLETE))
3032c4
       break;
3032c4
     if (!poolGrow(pool))
3032c4
       return NULL;
3032c4
@@ -6233,8 +6234,13 @@
3032c4
     }
3032c4
   }
3032c4
   if (pool->blocks && pool->start == pool->blocks->s) {
3032c4
-    int blockSize = (int)(pool->end - pool->start)*2;
3032c4
-    BLOCK *temp = (BLOCK *)
3032c4
+    BLOCK *temp;
3032c4
+    int blockSize = (int)((unsigned)(pool->end - pool->start)*2U);
3032c4
+
3032c4
+    if (blockSize < 0)
3032c4
+      return XML_FALSE;
3032c4
+
3032c4
+    temp = (BLOCK *)
3032c4
       pool->mem->realloc_fcn(pool->blocks,
3032c4
                              (offsetof(BLOCK, s)
3032c4
                               + blockSize * sizeof(XML_Char)));
3032c4
@@ -6249,6 +6255,10 @@
3032c4
   else {
3032c4
     BLOCK *tem;
3032c4
     int blockSize = (int)(pool->end - pool->start);
3032c4
+
3032c4
+    if (blockSize < 0)
3032c4
+      return XML_FALSE;
3032c4
+
3032c4
     if (blockSize < INIT_BLOCK_SIZE)
3032c4
       blockSize = INIT_BLOCK_SIZE;
3032c4
     else
3032c4
diff -uap expat-2.1.0/lib/xmltok.c.cve0718 expat-2.1.0/lib/xmltok.c
3032c4
--- expat-2.1.0/lib/xmltok.c.cve0718
3032c4
+++ expat-2.1.0/lib/xmltok.c
3032c4
@@ -318,39 +318,55 @@
3032c4
   UTF8_cval4 = 0xf0
3032c4
 };
3032c4
 
3032c4
-static void PTRCALL
3032c4
+static enum XML_Convert_Result PTRCALL
3032c4
 utf8_toUtf8(const ENCODING *enc,
3032c4
             const char **fromP, const char *fromLim,
3032c4
             char **toP, const char *toLim)
3032c4
 {
3032c4
+  enum XML_Convert_Result res = XML_CONVERT_COMPLETED;
3032c4
   char *to;
3032c4
   const char *from;
3032c4
   if (fromLim - *fromP > toLim - *toP) {
3032c4
     /* Avoid copying partial characters. */
3032c4
+    res = XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
     for (fromLim = *fromP + (toLim - *toP); fromLim > *fromP; fromLim--)
3032c4
       if (((unsigned char)fromLim[-1] & 0xc0) != 0x80)
3032c4
         break;
3032c4
   }
3032c4
-  for (to = *toP, from = *fromP; from != fromLim; from++, to++)
3032c4
+  for (to = *toP, from = *fromP; (from < fromLim) && (to < toLim); from++, to++)
3032c4
     *to = *from;
3032c4
   *fromP = from;
3032c4
   *toP = to;
3032c4
+
3032c4
+  if ((to == toLim) && (from < fromLim))
3032c4
+    return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
+  else
3032c4
+    return res;
3032c4
 }
3032c4
 
3032c4
-static void PTRCALL
3032c4
+static enum XML_Convert_Result PTRCALL
3032c4
 utf8_toUtf16(const ENCODING *enc,
3032c4
              const char **fromP, const char *fromLim,
3032c4
              unsigned short **toP, const unsigned short *toLim)
3032c4
 {
3032c4
+  enum XML_Convert_Result res = XML_CONVERT_COMPLETED;
3032c4
   unsigned short *to = *toP;
3032c4
   const char *from = *fromP;
3032c4
-  while (from != fromLim && to != toLim) {
3032c4
+  while (from < fromLim && to < toLim) {
3032c4
     switch (((struct normal_encoding *)enc)->type[(unsigned char)*from]) {
3032c4
     case BT_LEAD2:
3032c4
+      if (fromLim - from < 2) {
3032c4
+        res = XML_CONVERT_INPUT_INCOMPLETE;
3032c4
+        break;
3032c4
+      }
3032c4
       *to++ = (unsigned short)(((from[0] & 0x1f) << 6) | (from[1] & 0x3f));
3032c4
       from += 2;
3032c4
       break;
3032c4
     case BT_LEAD3:
3032c4
+      if (fromLim - from < 3) {
3032c4
+        res = XML_CONVERT_INPUT_INCOMPLETE;
3032c4
+        break;
3032c4
+      }
3032c4
       *to++ = (unsigned short)(((from[0] & 0xf) << 12)
3032c4
                                | ((from[1] & 0x3f) << 6) | (from[2] & 0x3f));
3032c4
       from += 3;
3032c4
@@ -358,8 +374,14 @@
3032c4
     case BT_LEAD4:
3032c4
       {
3032c4
         unsigned long n;
3032c4
-        if (to + 1 == toLim)
3032c4
+        if (toLim - to < 2) {
3032c4
+          res = XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
           goto after;
3032c4
+        }
3032c4
+        if (fromLim - from < 4) {
3032c4
+          res = XML_CONVERT_INPUT_INCOMPLETE;
3032c4
+          goto after;
3032c4
+        }
3032c4
         n = ((from[0] & 0x7) << 18) | ((from[1] & 0x3f) << 12)
3032c4
             | ((from[2] & 0x3f) << 6) | (from[3] & 0x3f);
3032c4
         n -= 0x10000;
3032c4
@@ -377,6 +399,7 @@
3032c4
 after:
3032c4
   *fromP = from;
3032c4
   *toP = to;
3032c4
+  return res;
3032c4
 }
3032c4
 
3032c4
 #ifdef XML_NS
3032c4
@@ -425,7 +448,7 @@
3032c4
   STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
3032c4
 };
3032c4
 
3032c4
-static void PTRCALL
3032c4
+static enum XML_Convert_Result PTRCALL
3032c4
 latin1_toUtf8(const ENCODING *enc,
3032c4
               const char **fromP, const char *fromLim,
3032c4
               char **toP, const char *toLim)
3032c4
@@ -433,30 +456,35 @@
3032c4
   for (;;) {
3032c4
     unsigned char c;
3032c4
     if (*fromP == fromLim)
3032c4
-      break;
3032c4
+      return XML_CONVERT_COMPLETED;
3032c4
     c = (unsigned char)**fromP;
3032c4
     if (c & 0x80) {
3032c4
       if (toLim - *toP < 2)
3032c4
-        break;
3032c4
+        return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
       *(*toP)++ = (char)((c >> 6) | UTF8_cval2);
3032c4
       *(*toP)++ = (char)((c & 0x3f) | 0x80);
3032c4
       (*fromP)++;
3032c4
     }
3032c4
     else {
3032c4
       if (*toP == toLim)
3032c4
-        break;
3032c4
+        return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
       *(*toP)++ = *(*fromP)++;
3032c4
     }
3032c4
   }
3032c4
 }
3032c4
 
3032c4
-static void PTRCALL
3032c4
+static enum XML_Convert_Result PTRCALL
3032c4
 latin1_toUtf16(const ENCODING *enc,
3032c4
                const char **fromP, const char *fromLim,
3032c4
                unsigned short **toP, const unsigned short *toLim)
3032c4
 {
3032c4
-  while (*fromP != fromLim && *toP != toLim)
3032c4
+  while (*fromP < fromLim && *toP < toLim)
3032c4
     *(*toP)++ = (unsigned char)*(*fromP)++;
3032c4
+
3032c4
+  if ((*toP == toLim) && (*fromP < fromLim))
3032c4
+    return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
+  else
3032c4
+    return XML_CONVERT_COMPLETED;
3032c4
 }
3032c4
 
3032c4
 #ifdef XML_NS
3032c4
@@ -483,13 +511,18 @@
3032c4
   STANDARD_VTABLE(sb_)
3032c4
 };
3032c4
 
3032c4
-static void PTRCALL
3032c4
+static enum XML_Convert_Result PTRCALL
3032c4
 ascii_toUtf8(const ENCODING *enc,
3032c4
              const char **fromP, const char *fromLim,
3032c4
              char **toP, const char *toLim)
3032c4
 {
3032c4
-  while (*fromP != fromLim && *toP != toLim)
3032c4
+  while (*fromP < fromLim && *toP < toLim)
3032c4
     *(*toP)++ = *(*fromP)++;
3032c4
+
3032c4
+  if ((*toP == toLim) && (*fromP < fromLim))
3032c4
+    return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
+  else
3032c4
+    return XML_CONVERT_COMPLETED;
3032c4
 }
3032c4
 
3032c4
 #ifdef XML_NS
3032c4
@@ -536,13 +569,14 @@
3032c4
 }
3032c4
 
3032c4
 #define DEFINE_UTF16_TO_UTF8(E) \
3032c4
-static void  PTRCALL \
3032c4
+static enum XML_Convert_Result  PTRCALL \
3032c4
 E ## toUtf8(const ENCODING *enc, \
3032c4
             const char **fromP, const char *fromLim, \
3032c4
             char **toP, const char *toLim) \
3032c4
 { \
3032c4
-  const char *from; \
3032c4
-  for (from = *fromP; from != fromLim; from += 2) { \
3032c4
+  const char *from = *fromP; \
3032c4
+  fromLim = from + (((fromLim - from) >> 1) << 1);  /* shrink to even */ \
3032c4
+  for (; from < fromLim; from += 2) { \
3032c4
     int plane; \
3032c4
     unsigned char lo2; \
3032c4
     unsigned char lo = GET_LO(from); \
3032c4
@@ -552,7 +586,7 @@
3032c4
       if (lo < 0x80) { \
3032c4
         if (*toP == toLim) { \
3032c4
           *fromP = from; \
3032c4
-          return; \
3032c4
+          return XML_CONVERT_OUTPUT_EXHAUSTED; \
3032c4
         } \
3032c4
         *(*toP)++ = lo; \
3032c4
         break; \
3032c4
@@ -562,7 +596,7 @@
3032c4
     case 0x4: case 0x5: case 0x6: case 0x7: \
3032c4
       if (toLim -  *toP < 2) { \
3032c4
         *fromP = from; \
3032c4
-        return; \
3032c4
+        return XML_CONVERT_OUTPUT_EXHAUSTED; \
3032c4
       } \
3032c4
       *(*toP)++ = ((lo >> 6) | (hi << 2) |  UTF8_cval2); \
3032c4
       *(*toP)++ = ((lo & 0x3f) | 0x80); \
3032c4
@@ -570,7 +604,7 @@
3032c4
     default: \
3032c4
       if (toLim -  *toP < 3)  { \
3032c4
         *fromP = from; \
3032c4
-        return; \
3032c4
+        return XML_CONVERT_OUTPUT_EXHAUSTED; \
3032c4
       } \
3032c4
       /* 16 bits divided 4, 6, 6 amongst 3 bytes */ \
3032c4
       *(*toP)++ = ((hi >> 4) | UTF8_cval3); \
3032c4
@@ -580,7 +614,11 @@
3032c4
     case 0xD8: case 0xD9: case 0xDA: case 0xDB: \
3032c4
       if (toLim -  *toP < 4) { \
3032c4
         *fromP = from; \
3032c4
-        return; \
3032c4
+        return XML_CONVERT_OUTPUT_EXHAUSTED; \
3032c4
+      } \
3032c4
+      if (fromLim - from < 4) { \
3032c4
+        *fromP = from; \
3032c4
+        return XML_CONVERT_INPUT_INCOMPLETE; \
3032c4
       } \
3032c4
       plane = (((hi & 0x3) << 2) | ((lo >> 6) & 0x3)) + 1; \
3032c4
       *(*toP)++ = ((plane >> 2) | UTF8_cval4); \
3032c4
@@ -596,20 +634,32 @@
3032c4
     } \
3032c4
   } \
3032c4
   *fromP = from; \
3032c4
+  if (from < fromLim) \
3032c4
+    return XML_CONVERT_INPUT_INCOMPLETE; \
3032c4
+  else \
3032c4
+    return XML_CONVERT_COMPLETED; \
3032c4
 }
3032c4
 
3032c4
 #define DEFINE_UTF16_TO_UTF16(E) \
3032c4
-static void  PTRCALL \
3032c4
+static enum XML_Convert_Result  PTRCALL \
3032c4
 E ## toUtf16(const ENCODING *enc, \
3032c4
              const char **fromP, const char *fromLim, \
3032c4
              unsigned short **toP, const unsigned short *toLim) \
3032c4
 { \
3032c4
+  enum XML_Convert_Result res = XML_CONVERT_COMPLETED; \
3032c4
+  fromLim = *fromP + (((fromLim - *fromP) >> 1) << 1);  /* shrink to even */ \
3032c4
   /* Avoid copying first half only of surrogate */ \
3032c4
   if (fromLim - *fromP > ((toLim - *toP) << 1) \
3032c4
-      && (GET_HI(fromLim - 2) & 0xF8) == 0xD8) \
3032c4
+      && (GET_HI(fromLim - 2) & 0xF8) == 0xD8) { \
3032c4
     fromLim -= 2; \
3032c4
-  for (; *fromP != fromLim && *toP != toLim; *fromP += 2) \
3032c4
+    res = XML_CONVERT_INPUT_INCOMPLETE; \
3032c4
+  } \
3032c4
+  for (; *fromP < fromLim && *toP < toLim; *fromP += 2) \
3032c4
     *(*toP)++ = (GET_HI(*fromP) << 8) | GET_LO(*fromP); \
3032c4
+  if ((*toP == toLim) && (*fromP < fromLim)) \
3032c4
+    return XML_CONVERT_OUTPUT_EXHAUSTED; \
3032c4
+  else \
3032c4
+    return res; \
3032c4
 }
3032c4
 
3032c4
 #define SET2(ptr, ch) \
3032c4
@@ -1288,7 +1338,7 @@
3032c4
   return (c & ~0xFFFF) || checkCharRefNumber(c) < 0;
3032c4
 }
3032c4
 
3032c4
-static void PTRCALL
3032c4
+static enum XML_Convert_Result PTRCALL
3032c4
 unknown_toUtf8(const ENCODING *enc,
3032c4
                const char **fromP, const char *fromLim,
3032c4
                char **toP, const char *toLim)
3032c4
@@ -1299,21 +1349,21 @@
3032c4
     const char *utf8;
3032c4
     int n;
3032c4
     if (*fromP == fromLim)
3032c4
-      break;
3032c4
+      return XML_CONVERT_COMPLETED;
3032c4
     utf8 = uenc->utf8[(unsigned char)**fromP];
3032c4
     n = *utf8++;
3032c4
     if (n == 0) {
3032c4
       int c = uenc->convert(uenc->userData, *fromP);
3032c4
       n = XmlUtf8Encode(c, buf);
3032c4
       if (n > toLim - *toP)
3032c4
-        break;
3032c4
+        return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
       utf8 = buf;
3032c4
       *fromP += (AS_NORMAL_ENCODING(enc)->type[(unsigned char)**fromP]
3032c4
                  - (BT_LEAD2 - 2));
3032c4
     }
3032c4
     else {
3032c4
       if (n > toLim - *toP)
3032c4
-        break;
3032c4
+        return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
       (*fromP)++;
3032c4
     }
3032c4
     do {
3032c4
@@ -1322,13 +1372,13 @@
3032c4
   }
3032c4
 }
3032c4
 
3032c4
-static void PTRCALL
3032c4
+static enum XML_Convert_Result PTRCALL
3032c4
 unknown_toUtf16(const ENCODING *enc,
3032c4
                 const char **fromP, const char *fromLim,
3032c4
                 unsigned short **toP, const unsigned short *toLim)
3032c4
 {
3032c4
   const struct unknown_encoding *uenc = AS_UNKNOWN_ENCODING(enc);
3032c4
-  while (*fromP != fromLim && *toP != toLim) {
3032c4
+  while (*fromP < fromLim && *toP < toLim) {
3032c4
     unsigned short c = uenc->utf16[(unsigned char)**fromP];
3032c4
     if (c == 0) {
3032c4
       c = (unsigned short)
3032c4
@@ -1340,6 +1390,11 @@
3032c4
       (*fromP)++;
3032c4
     *(*toP)++ = c;
3032c4
   }
3032c4
+
3032c4
+  if ((*toP == toLim) && (*fromP < fromLim))
3032c4
+    return XML_CONVERT_OUTPUT_EXHAUSTED;
3032c4
+  else
3032c4
+    return XML_CONVERT_COMPLETED;
3032c4
 }
3032c4
 
3032c4
 ENCODING *
3032c4
@@ -1503,7 +1558,7 @@
3032c4
 {
3032c4
   const ENCODING **encPtr;
3032c4
 
3032c4
-  if (ptr == end)
3032c4
+  if (ptr >= end)
3032c4
     return XML_TOK_NONE;
3032c4
   encPtr = enc->encPtr;
3032c4
   if (ptr + 1 == end) {
3032c4
diff -uap expat-2.1.0/lib/xmltok.h.cve0718 expat-2.1.0/lib/xmltok.h
3032c4
--- expat-2.1.0/lib/xmltok.h.cve0718
3032c4
+++ expat-2.1.0/lib/xmltok.h
3032c4
@@ -130,6 +130,12 @@
3032c4
                                const char *,
3032c4
                                const char **);
3032c4
 
3032c4
+enum XML_Convert_Result {
3032c4
+  XML_CONVERT_COMPLETED = 0,
3032c4
+  XML_CONVERT_INPUT_INCOMPLETE = 1,
3032c4
+  XML_CONVERT_OUTPUT_EXHAUSTED = 2  /* and therefore potentially input remaining as well */
3032c4
+};
3032c4
+
3032c4
 struct encoding {
3032c4
   SCANNER scanners[XML_N_STATES];
3032c4
   SCANNER literalScanners[XML_N_LITERAL_TYPES];
3032c4
@@ -158,12 +164,12 @@
3032c4
                             const char *ptr,
3032c4
                             const char *end,
3032c4
                             const char **badPtr);
3032c4
-  void (PTRCALL *utf8Convert)(const ENCODING *enc,
3032c4
+  enum XML_Convert_Result (PTRCALL *utf8Convert)(const ENCODING *enc,
3032c4
                               const char **fromP,
3032c4
                               const char *fromLim,
3032c4
                               char **toP,
3032c4
                               const char *toLim);
3032c4
-  void (PTRCALL *utf16Convert)(const ENCODING *enc,
3032c4
+  enum XML_Convert_Result (PTRCALL *utf16Convert)(const ENCODING *enc,
3032c4
                                const char **fromP,
3032c4
                                const char *fromLim,
3032c4
                                unsigned short **toP,
3032c4
diff -uap expat-2.1.0/lib/xmltok_impl.c.cve0718 expat-2.1.0/lib/xmltok_impl.c
3032c4
--- expat-2.1.0/lib/xmltok_impl.c.cve0718
3032c4
+++ expat-2.1.0/lib/xmltok_impl.c
3032c4
@@ -93,13 +93,13 @@
3032c4
 PREFIX(scanComment)(const ENCODING *enc, const char *ptr,
3032c4
                     const char *end, const char **nextTokPtr)
3032c4
 {
3032c4
-  if (ptr != end) {
3032c4
+  if (ptr < end) {
3032c4
     if (!CHAR_MATCHES(enc, ptr, ASCII_MINUS)) {
3032c4
       *nextTokPtr = ptr;
3032c4
       return XML_TOK_INVALID;
3032c4
     }
3032c4
     ptr += MINBPC(enc);
3032c4
-    while (ptr != end) {
3032c4
+    while (ptr < end) {
3032c4
       switch (BYTE_TYPE(enc, ptr)) {
3032c4
       INVALID_CASES(ptr, nextTokPtr)
3032c4
       case BT_MINUS:
3032c4
@@ -147,7 +147,7 @@
3032c4
     *nextTokPtr = ptr;
3032c4
     return XML_TOK_INVALID;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     case BT_PERCNT:
3032c4
       if (ptr + MINBPC(enc) == end)
3032c4
@@ -233,7 +233,7 @@
3032c4
     *nextTokPtr = ptr;
3032c4
     return XML_TOK_INVALID;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
     case BT_S: case BT_CR: case BT_LF:
3032c4
@@ -242,7 +242,7 @@
3032c4
         return XML_TOK_INVALID;
3032c4
       }
3032c4
       ptr += MINBPC(enc);
3032c4
-      while (ptr != end) {
3032c4
+      while (ptr < end) {
3032c4
         switch (BYTE_TYPE(enc, ptr)) {
3032c4
         INVALID_CASES(ptr, nextTokPtr)
3032c4
         case BT_QUEST:
3032c4
@@ -305,7 +305,7 @@
3032c4
 PREFIX(cdataSectionTok)(const ENCODING *enc, const char *ptr,
3032c4
                         const char *end, const char **nextTokPtr)
3032c4
 {
3032c4
-  if (ptr == end)
3032c4
+  if (ptr >= end)
3032c4
     return XML_TOK_NONE;
3032c4
   if (MINBPC(enc) > 1) {
3032c4
     size_t n = end - ptr;
3032c4
@@ -348,7 +348,7 @@
3032c4
     ptr += MINBPC(enc);
3032c4
     break;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
 #define LEAD_CASE(n) \
3032c4
     case BT_LEAD ## n: \
3032c4
@@ -391,11 +391,11 @@
3032c4
     *nextTokPtr = ptr;
3032c4
     return XML_TOK_INVALID;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
     case BT_S: case BT_CR: case BT_LF:
3032c4
-      for (ptr += MINBPC(enc); ptr != end; ptr += MINBPC(enc)) {
3032c4
+      for (ptr += MINBPC(enc); ptr < end; ptr += MINBPC(enc)) {
3032c4
         switch (BYTE_TYPE(enc, ptr)) {
3032c4
         case BT_S: case BT_CR: case BT_LF:
3032c4
           break;
3032c4
@@ -432,7 +432,7 @@
3032c4
 PREFIX(scanHexCharRef)(const ENCODING *enc, const char *ptr,
3032c4
                        const char *end, const char **nextTokPtr)
3032c4
 {
3032c4
-  if (ptr != end) {
3032c4
+  if (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     case BT_DIGIT:
3032c4
     case BT_HEX:
3032c4
@@ -441,7 +441,7 @@
3032c4
       *nextTokPtr = ptr;
3032c4
       return XML_TOK_INVALID;
3032c4
     }
3032c4
-    for (ptr += MINBPC(enc); ptr != end; ptr += MINBPC(enc)) {
3032c4
+    for (ptr += MINBPC(enc); ptr < end; ptr += MINBPC(enc)) {
3032c4
       switch (BYTE_TYPE(enc, ptr)) {
3032c4
       case BT_DIGIT:
3032c4
       case BT_HEX:
3032c4
@@ -464,7 +464,7 @@
3032c4
 PREFIX(scanCharRef)(const ENCODING *enc, const char *ptr,
3032c4
                     const char *end, const char **nextTokPtr)
3032c4
 {
3032c4
-  if (ptr != end) {
3032c4
+  if (ptr < end) {
3032c4
     if (CHAR_MATCHES(enc, ptr, ASCII_x))
3032c4
       return PREFIX(scanHexCharRef)(enc, ptr + MINBPC(enc), end, nextTokPtr);
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
@@ -474,7 +474,7 @@
3032c4
       *nextTokPtr = ptr;
3032c4
       return XML_TOK_INVALID;
3032c4
     }
3032c4
-    for (ptr += MINBPC(enc); ptr != end; ptr += MINBPC(enc)) {
3032c4
+    for (ptr += MINBPC(enc); ptr < end; ptr += MINBPC(enc)) {
3032c4
       switch (BYTE_TYPE(enc, ptr)) {
3032c4
       case BT_DIGIT:
3032c4
         break;
3032c4
@@ -506,7 +506,7 @@
3032c4
     *nextTokPtr = ptr;
3032c4
     return XML_TOK_INVALID;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
     case BT_SEMI:
3032c4
@@ -529,7 +529,7 @@
3032c4
 #ifdef XML_NS
3032c4
   int hadColon = 0;
3032c4
 #endif
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
 #ifdef XML_NS
3032c4
@@ -716,7 +716,7 @@
3032c4
   hadColon = 0;
3032c4
 #endif
3032c4
   /* we have a start-tag */
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
 #ifdef XML_NS
3032c4
@@ -740,7 +740,7 @@
3032c4
     case BT_S: case BT_CR: case BT_LF:
3032c4
       {
3032c4
         ptr += MINBPC(enc);
3032c4
-        while (ptr != end) {
3032c4
+        while (ptr < end) {
3032c4
           switch (BYTE_TYPE(enc, ptr)) {
3032c4
           CHECK_NMSTRT_CASES(enc, ptr, end, nextTokPtr)
3032c4
           case BT_GT:
3032c4
@@ -785,7 +785,7 @@
3032c4
 PREFIX(contentTok)(const ENCODING *enc, const char *ptr, const char *end,
3032c4
                    const char **nextTokPtr)
3032c4
 {
3032c4
-  if (ptr == end)
3032c4
+  if (ptr >= end)
3032c4
     return XML_TOK_NONE;
3032c4
   if (MINBPC(enc) > 1) {
3032c4
     size_t n = end - ptr;
3032c4
@@ -832,7 +832,7 @@
3032c4
     ptr += MINBPC(enc);
3032c4
     break;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
 #define LEAD_CASE(n) \
3032c4
     case BT_LEAD ## n: \
3032c4
@@ -895,7 +895,7 @@
3032c4
     *nextTokPtr = ptr;
3032c4
     return XML_TOK_INVALID;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
     case BT_SEMI:
3032c4
@@ -921,7 +921,7 @@
3032c4
     *nextTokPtr = ptr;
3032c4
     return XML_TOK_INVALID;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
     case BT_CR: case BT_LF: case BT_S:
3032c4
@@ -941,7 +941,7 @@
3032c4
                 const char *ptr, const char *end,
3032c4
                 const char **nextTokPtr)
3032c4
 {
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     int t = BYTE_TYPE(enc, ptr);
3032c4
     switch (t) {
3032c4
     INVALID_CASES(ptr, nextTokPtr)
3032c4
@@ -973,7 +973,7 @@
3032c4
                   const char **nextTokPtr)
3032c4
 {
3032c4
   int tok;
3032c4
-  if (ptr == end)
3032c4
+  if (ptr >= end)
3032c4
     return XML_TOK_NONE;
3032c4
   if (MINBPC(enc) > 1) {
3032c4
     size_t n = end - ptr;
3032c4
@@ -1141,7 +1141,7 @@
3032c4
     *nextTokPtr = ptr;
3032c4
     return XML_TOK_INVALID;
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     CHECK_NAME_CASES(enc, ptr, end, nextTokPtr)
3032c4
     case BT_GT: case BT_RPAR: case BT_COMMA:
3032c4
@@ -1204,10 +1204,10 @@
3032c4
                           const char *end, const char **nextTokPtr)
3032c4
 {
3032c4
   const char *start;
3032c4
-  if (ptr == end)
3032c4
+  if (ptr >= end)
3032c4
     return XML_TOK_NONE;
3032c4
   start = ptr;
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
 #define LEAD_CASE(n) \
3032c4
     case BT_LEAD ## n: ptr += n; break;
3032c4
@@ -1262,10 +1262,10 @@
3032c4
                        const char *end, const char **nextTokPtr)
3032c4
 {
3032c4
   const char *start;
3032c4
-  if (ptr == end)
3032c4
+  if (ptr >= end)
3032c4
     return XML_TOK_NONE;
3032c4
   start = ptr;
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
 #define LEAD_CASE(n) \
3032c4
     case BT_LEAD ## n: ptr += n; break;
3032c4
@@ -1326,7 +1326,7 @@
3032c4
       end = ptr + n;
3032c4
     }
3032c4
   }
3032c4
-  while (ptr != end) {
3032c4
+  while (ptr < end) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     INVALID_CASES(ptr, nextTokPtr)
3032c4
     case BT_LT:
3032c4
@@ -1373,7 +1373,7 @@
3032c4
 {
3032c4
   ptr += MINBPC(enc);
3032c4
   end -= MINBPC(enc);
3032c4
-  for (; ptr != end; ptr += MINBPC(enc)) {
3032c4
+  for (; ptr < end; ptr += MINBPC(enc)) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
     case BT_DIGIT:
3032c4
     case BT_HEX:
3032c4
@@ -1744,7 +1744,7 @@
3032c4
                        const char *end,
3032c4
                        POSITION *pos)
3032c4
 {
3032c4
-  while (ptr < end) {
3032c4
+  while (end - ptr >= MINBPC(enc)) {
3032c4
     switch (BYTE_TYPE(enc, ptr)) {
3032c4
 #define LEAD_CASE(n) \
3032c4
     case BT_LEAD ## n: \
3032c4
@@ -1760,7 +1760,7 @@
3032c4
     case BT_CR:
3032c4
       pos->lineNumber++;
3032c4
       ptr += MINBPC(enc);
3032c4
-      if (ptr != end && BYTE_TYPE(enc, ptr) == BT_LF)
3032c4
+      if (ptr < end && BYTE_TYPE(enc, ptr) == BT_LF)
3032c4
         ptr += MINBPC(enc);
3032c4
       pos->columnNumber = (XML_Size)-1;
3032c4
       break;