]> git.tdb.fi Git - ext/subsurface.git/blob - parse-xml.c
First steps towards integrating SDA files into the default XML loading
[ext/subsurface.git] / parse-xml.c
1 #include <stdio.h>
2 #include <ctype.h>
3 #include <string.h>
4 #include <stdlib.h>
5 #include <errno.h>
6 #include <time.h>
7 #include <libxml/parser.h>
8 #include <libxml/tree.h>
9
10 #include "dive.h"
11 #include "uemis.h"
12
13 int verbose;
14
15 struct dive_table dive_table;
16
17 /*
18  * Add a dive into the dive_table array
19  */
20 void record_dive(struct dive *dive)
21 {
22         int nr = dive_table.nr, allocated = dive_table.allocated;
23         struct dive **dives = dive_table.dives;
24
25         if (nr >= allocated) {
26                 allocated = (nr + 32) * 3 / 2;
27                 dives = realloc(dives, allocated * sizeof(struct dive *));
28                 if (!dives)
29                         exit(1);
30                 dive_table.dives = dives;
31                 dive_table.allocated = allocated;
32         }
33         dives[nr] = fixup_dive(dive);
34         dive_table.nr = nr+1;
35 }
36
37 static void start_match(const char *type, const char *name, char *buffer)
38 {
39         if (verbose > 2)
40                 printf("Matching %s '%s' (%s)\n",
41                         type, name, buffer);
42 }
43
44 static void nonmatch(const char *type, const char *name, char *buffer)
45 {
46         if (verbose > 1)
47                 printf("Unable to match %s '%s' (%s)\n",
48                         type, name, buffer);
49         free(buffer);
50 }
51
52 typedef void (*matchfn_t)(char *buffer, void *);
53
54 static int match(const char *pattern, int plen,
55                  const char *name, int nlen,
56                  matchfn_t fn, char *buf, void *data)
57 {
58         if (plen > nlen)
59                 return 0;
60         if (memcmp(pattern, name + nlen - plen, plen))
61                 return 0;
62         fn(buf, data);
63         return 1;
64 }
65
66
67 struct units input_units;
68
69 /*
70  * We're going to default to SI units for input. Yes,
71  * technically the SI unit for pressure is Pascal, but
72  * we default to bar (10^5 pascal), which people
73  * actually use. Similarly, C instead of Kelvin.
74  */
75 const struct units SI_units = {
76         .length = METERS,
77         .volume = LITER,
78         .pressure = BAR,
79         .temperature = CELSIUS,
80         .weight = KG
81 };
82
83 const struct units IMPERIAL_units = {
84         .length = FEET,
85         .volume = CUFT,
86         .pressure = PSI,
87         .temperature = FAHRENHEIT,
88         .weight = LBS
89 };
90
91 /*
92  * Dive info as it is being built up..
93  */
94 static struct dive *dive;
95 static struct sample *sample;
96 static struct {
97         int active;
98         duration_t time;
99         int type, flags, value;
100         const char *name;
101 } event;
102 static struct tm tm;
103 static int cylinder_index;
104
105 static enum import_source {
106         UNKNOWN,
107         LIBDIVECOMPUTER,
108         SUUNTO,
109         UEMIS,
110         DIVINGLOG,
111         UDDF,
112 } import_source;
113
114 time_t utc_mktime(struct tm *tm)
115 {
116         static const int mdays[] = {
117             0, 31, 59, 90, 120, 151, 181, 212, 243, 273, 304, 334
118         };
119         int year = tm->tm_year;
120         int month = tm->tm_mon;
121         int day = tm->tm_mday;
122
123         /* First normalize relative to 1900 */
124         if (year < 70)
125                 year += 100;
126         else if (year > 1900)
127                 year -= 1900;
128
129         /* Normalized to Jan 1, 1970: unix time */
130         year -= 70;
131
132         if (year < 0 || year > 129) /* algo only works for 1970-2099 */
133                 return -1;
134         if (month < 0 || month > 11) /* array bounds */
135                 return -1;
136         if (month < 2 || (year + 2) % 4)
137                 day--;
138         if (tm->tm_hour < 0 || tm->tm_min < 0 || tm->tm_sec < 0)
139                 return -1;
140         return (year * 365 + (year + 1) / 4 + mdays[month] + day) * 24*60*60UL +
141                 tm->tm_hour * 60*60 + tm->tm_min * 60 + tm->tm_sec;
142 }
143
144 static void divedate(char *buffer, void *_when)
145 {
146         int d,m,y;
147         time_t *when = _when;
148         int success = 0;
149
150         success = tm.tm_sec | tm.tm_min | tm.tm_hour;
151         if (sscanf(buffer, "%d.%d.%d", &d, &m, &y) == 3) {
152                 tm.tm_year = y;
153                 tm.tm_mon = m-1;
154                 tm.tm_mday = d;
155         } else if (sscanf(buffer, "%d-%d-%d", &y, &m, &d) == 3) {
156                 tm.tm_year = y;
157                 tm.tm_mon = m-1;
158                 tm.tm_mday = d;
159         } else {
160                 fprintf(stderr, "Unable to parse date '%s'\n", buffer);
161                 success = 0;
162         }
163
164         if (success)
165                 *when = utc_mktime(&tm);
166
167         free(buffer);
168 }
169
170 static void divetime(char *buffer, void *_when)
171 {
172         int h,m,s = 0;
173         time_t *when = _when;
174
175         if (sscanf(buffer, "%d:%d:%d", &h, &m, &s) >= 2) {
176                 tm.tm_hour = h;
177                 tm.tm_min = m;
178                 tm.tm_sec = s;
179                 if (tm.tm_year)
180                         *when = utc_mktime(&tm);
181         }
182         free(buffer);
183 }
184
185 /* Libdivecomputer: "2011-03-20 10:22:38" */
186 static void divedatetime(char *buffer, void *_when)
187 {
188         int y,m,d;
189         int hr,min,sec;
190         time_t *when = _when;
191
192         if (sscanf(buffer, "%d-%d-%d %d:%d:%d",
193                 &y, &m, &d, &hr, &min, &sec) == 6) {
194                 tm.tm_year = y;
195                 tm.tm_mon = m-1;
196                 tm.tm_mday = d;
197                 tm.tm_hour = hr;
198                 tm.tm_min = min;
199                 tm.tm_sec = sec;
200                 *when = utc_mktime(&tm);
201         }
202         free(buffer);
203 }
204
205 union int_or_float {
206         double fp;
207 };
208
209 enum number_type {
210         NEITHER,
211         FLOAT
212 };
213
214 static enum number_type integer_or_float(char *buffer, union int_or_float *res)
215 {
216         char *end;
217         long val;
218         double fp;
219
220         /* Integer or floating point? */
221         val = strtol(buffer, &end, 10);
222         if (val < 0 || end == buffer)
223                 return NEITHER;
224
225         /* Looks like it might be floating point? */
226         if (*end == '.') {
227                 errno = 0;
228                 fp = strtod(buffer, &end);
229                 if (!errno) {
230                         res->fp = fp;
231                         return FLOAT;
232                 }
233         }
234
235         res->fp = val;
236         return FLOAT;
237 }
238
239 static void pressure(char *buffer, void *_press)
240 {
241         double mbar;
242         pressure_t *pressure = _press;
243         union int_or_float val;
244
245         switch (integer_or_float(buffer, &val)) {
246         case FLOAT:
247                 /* Just ignore zero values */
248                 if (!val.fp)
249                         break;
250                 switch (input_units.pressure) {
251                 case PASCAL:
252                         mbar = val.fp / 100;
253                         break;
254                 case BAR:
255                         /* Assume mbar, but if it's really small, it's bar */
256                         mbar = val.fp;
257                         if (mbar < 5000)
258                                 mbar = mbar * 1000;
259                         break;
260                 case PSI:
261                         mbar = val.fp * 68.95;
262                         break;
263                 }
264                 if (mbar > 5 && mbar < 500000) {
265                         pressure->mbar = mbar + 0.5;
266                         break;
267                 }
268         /* fallthrough */
269         default:
270                 printf("Strange pressure reading %s\n", buffer);
271         }
272         free(buffer);
273 }
274
275 static void depth(char *buffer, void *_depth)
276 {
277         depth_t *depth = _depth;
278         union int_or_float val;
279
280         switch (integer_or_float(buffer, &val)) {
281         case FLOAT:
282                 switch (input_units.length) {
283                 case METERS:
284                         depth->mm = val.fp * 1000 + 0.5;
285                         break;
286                 case FEET:
287                         depth->mm = val.fp * 304.8 + 0.5;
288                         break;
289                 }
290                 break;
291         default:
292                 printf("Strange depth reading %s\n", buffer);
293         }
294         free(buffer);
295 }
296
297 static void temperature(char *buffer, void *_temperature)
298 {
299         temperature_t *temperature = _temperature;
300         union int_or_float val;
301
302         switch (integer_or_float(buffer, &val)) {
303         case FLOAT:
304                 /* Ignore zero. It means "none" */
305                 if (!val.fp)
306                         break;
307                 /* Celsius */
308                 switch (input_units.temperature) {
309                 case KELVIN:
310                         temperature->mkelvin = val.fp * 1000;
311                         break;
312                 case CELSIUS:
313                         temperature->mkelvin = (val.fp + 273.15) * 1000 + 0.5;
314                         break;
315                 case FAHRENHEIT:
316                         temperature->mkelvin = (val.fp + 459.67) * 5000/9;
317                         break;
318                 }
319                 break;
320         default:
321                 printf("Strange temperature reading %s\n", buffer);
322         }
323         free(buffer);
324 }
325
326 static void sampletime(char *buffer, void *_time)
327 {
328         int i;
329         int min, sec;
330         duration_t *time = _time;
331
332         i = sscanf(buffer, "%d:%d", &min, &sec);
333         switch (i) {
334         case 1:
335                 sec = min;
336                 min = 0;
337         /* fallthrough */
338         case 2:
339                 time->seconds = sec + min*60;
340                 break;
341         default:
342                 printf("Strange sample time reading %s\n", buffer);
343         }
344         free(buffer);
345 }
346
347 static void duration(char *buffer, void *_time)
348 {
349         sampletime(buffer, _time);
350 }
351
352 static void percent(char *buffer, void *_fraction)
353 {
354         fraction_t *fraction = _fraction;
355         union int_or_float val;
356
357         switch (integer_or_float(buffer, &val)) {
358         case FLOAT:
359                 if (val.fp <= 100.0)
360                         fraction->permille = val.fp * 10 + 0.5;
361                 break;
362
363         default:
364                 printf("Strange percentage reading %s\n", buffer);
365                 break;
366         }
367         free(buffer);
368 }
369
370 static void gasmix(char *buffer, void *_fraction)
371 {
372         /* libdivecomputer does negative percentages. */
373         if (*buffer == '-')
374                 return;
375         if (cylinder_index < MAX_CYLINDERS)
376                 percent(buffer, _fraction);
377 }
378
379 static void gasmix_nitrogen(char *buffer, void *_gasmix)
380 {
381         /* Ignore n2 percentages. There's no value in them. */
382 }
383
384 static void cylindersize(char *buffer, void *_volume)
385 {
386         volume_t *volume = _volume;
387         union int_or_float val;
388
389         switch (integer_or_float(buffer, &val)) {
390         case FLOAT:
391                 volume->mliter = val.fp * 1000 + 0.5;
392                 break;
393
394         default:
395                 printf("Strange volume reading %s\n", buffer);
396                 break;
397         }
398         free(buffer);
399 }
400
401 static void utf8_string(char *buffer, void *_res)
402 {
403         *(char **)_res = buffer;
404 }
405
406 /*
407  * Uemis water_pressure. In centibar. And when converting to
408  * depth, I'm just going to always use saltwater, because I
409  * think "true depth" is just stupid. From a diving standpoint,
410  * "true depth" is pretty much completely pointless, unless
411  * you're doing some kind of underwater surveying work.
412  *
413  * So I give water depths in "pressure depth", always assuming
414  * salt water. So one atmosphere per 10m.
415  */
416 static void water_pressure(char *buffer, void *_depth)
417 {
418         depth_t *depth = _depth;
419         union int_or_float val;
420         double atm, cm;
421
422         switch (integer_or_float(buffer, &val)) {
423         case FLOAT:
424                 if (!val.fp)
425                         break;
426                 /* cbar to atm */
427                 atm = (val.fp / 100) / 1.01325;
428                 /*
429                  * atm to cm. Why not mm? The precision just isn't
430                  * there.
431                  */
432                 cm = 100 * atm + 0.5;
433                 if (cm > 0) {
434                         depth->mm = 10 * (long)cm;
435                         break;
436                 }
437         default:
438                 fprintf(stderr, "Strange water pressure '%s'\n", buffer);
439         }
440         free(buffer);
441 }
442
443 #define MATCH(pattern, fn, dest) \
444         match(pattern, strlen(pattern), name, len, fn, buf, dest)
445
446 static void get_index(char *buffer, void *_i)
447 {
448         int *i = _i;
449         *i = atoi(buffer);
450         free(buffer);
451 }
452
453 static void centibar(char *buffer, void *_pressure)
454 {
455         pressure_t *pressure = _pressure;
456         union int_or_float val;
457
458         switch (integer_or_float(buffer, &val)) {
459         case FLOAT:
460                 pressure->mbar = val.fp * 10 + 0.5;
461                 break;
462         default:
463                 fprintf(stderr, "Strange centibar pressure '%s'\n", buffer);
464         }
465         free(buffer);
466 }
467
468 static void decicelsius(char *buffer, void *_temp)
469 {
470         temperature_t *temp = _temp;
471         union int_or_float val;
472
473         switch (integer_or_float(buffer, &val)) {
474         case FLOAT:
475                 temp->mkelvin = (val.fp/10 + 273.15) * 1000 + 0.5;
476                 break;
477         default:
478                 fprintf(stderr, "Strange julian date: %s", buffer);
479         }
480         free(buffer);
481 }
482
483 static int uemis_fill_sample(struct sample *sample, const char *name, int len, char *buf)
484 {
485         return  MATCH(".reading.dive_time", sampletime, &sample->time) ||
486                 MATCH(".reading.water_pressure", water_pressure, &sample->depth) ||
487                 MATCH(".reading.active_tank", get_index, &sample->cylinderindex) ||
488                 MATCH(".reading.tank_pressure", centibar, &sample->cylinderpressure) ||
489                 MATCH(".reading.dive_temperature", decicelsius, &sample->temperature) ||
490                 0;
491 }
492
493 /*
494  * Divinglog is crazy. The temperatures are in celsius. EXCEPT
495  * for the sample temperatures, that are in Fahrenheit.
496  * WTF?
497  *
498  * Oh, and I think Diving Log *internally* probably kept them
499  * in celsius, because I'm seeing entries like
500  *
501  *      <Temp>32.0</Temp>
502  *
503  * in there. Which is freezing, aka 0 degC. I bet the "0" is
504  * what Diving Log uses for "no temperature".
505  *
506  * So throw away crap like that.
507  */
508 static void fahrenheit(char *buffer, void *_temperature)
509 {
510         temperature_t *temperature = _temperature;
511         union int_or_float val;
512
513         switch (integer_or_float(buffer, &val)) {
514         case FLOAT:
515                 /* Floating point equality is evil, but works for small integers */
516                 if (val.fp == 32.0)
517                         break;
518                 temperature->mkelvin = (val.fp + 459.67) * 5000/9;
519                 break;
520         default:
521                 fprintf(stderr, "Crazy Diving Log temperature reading %s\n", buffer);
522         }
523         free(buffer);
524 }
525
526 /*
527  * Did I mention how bat-shit crazy divinglog is? The sample
528  * pressures are in PSI. But the tank working pressure is in
529  * bar. WTF^2?
530  *
531  * Crazy stuff like this is why subsurface has everything in
532  * these inconvenient typed structures, and you have to say
533  * "pressure->mbar" to get the actual value. Exactly so that
534  * you can never have unit confusion.
535  */
536 static void psi(char *buffer, void *_pressure)
537 {
538         pressure_t *pressure = _pressure;
539         union int_or_float val;
540
541         switch (integer_or_float(buffer, &val)) {
542         case FLOAT:
543                 pressure->mbar = val.fp * 68.95 + 0.5;
544                 break;
545         default:
546                 fprintf(stderr, "Crazy Diving Log PSI reading %s\n", buffer);
547         }
548         free(buffer);
549 }
550
551 static int divinglog_fill_sample(struct sample *sample, const char *name, int len, char *buf)
552 {
553         return  MATCH(".p.time", sampletime, &sample->time) ||
554                 MATCH(".p.depth", depth, &sample->depth) ||
555                 MATCH(".p.temp", fahrenheit, &sample->temperature) ||
556                 MATCH(".p.press1", psi, &sample->cylinderpressure) ||
557                 0;
558 }
559
560 static int uddf_fill_sample(struct sample *sample, const char *name, int len, char *buf)
561 {
562         return  MATCH(".divetime", sampletime, &sample->time) ||
563                 MATCH(".depth", depth, &sample->depth) ||
564                 MATCH(".temperature", temperature, &sample->temperature) ||
565                 0;
566 }
567
568 static void eventtime(char *buffer, void *_duration)
569 {
570         duration_t *duration = _duration;
571         sampletime(buffer, duration);
572         if (sample)
573                 duration->seconds += sample->time.seconds;
574 }
575
576 static void try_to_fill_event(const char *name, char *buf)
577 {
578         int len = strlen(name);
579
580         start_match("event", name, buf);
581         if (MATCH(".event", utf8_string, &event.name))
582                 return;
583         if (MATCH(".name", utf8_string, &event.name))
584                 return;
585         if (MATCH(".time", eventtime, &event.time))
586                 return;
587         if (MATCH(".type", get_index, &event.type))
588                 return;
589         if (MATCH(".flags", get_index, &event.flags))
590                 return;
591         if (MATCH(".value", get_index, &event.value))
592                 return;
593         nonmatch("event", name, buf);
594 }
595
596 /* We're in samples - try to convert the random xml value to something useful */
597 static void try_to_fill_sample(struct sample *sample, const char *name, char *buf)
598 {
599         int len = strlen(name);
600
601         start_match("sample", name, buf);
602         if (MATCH(".sample.pressure", pressure, &sample->cylinderpressure))
603                 return;
604         if (MATCH(".sample.cylpress", pressure, &sample->cylinderpressure))
605                 return;
606         if (MATCH(".sample.depth", depth, &sample->depth))
607                 return;
608         if (MATCH(".sample.temp", temperature, &sample->temperature))
609                 return;
610         if (MATCH(".sample.temperature", temperature, &sample->temperature))
611                 return;
612         if (MATCH(".sample.sampletime", sampletime, &sample->time))
613                 return;
614         if (MATCH(".sample.time", sampletime, &sample->time))
615                 return;
616
617         switch (import_source) {
618         case UEMIS:
619                 if (uemis_fill_sample(sample, name, len, buf))
620                         return;
621                 break;
622
623         case DIVINGLOG:
624                 if (divinglog_fill_sample(sample, name, len, buf))
625                         return;
626                 break;
627
628         case UDDF:
629                 if (uddf_fill_sample(sample, name, len, buf))
630                         return;
631                 break;
632
633         default:
634                 break;
635         }
636
637         nonmatch("sample", name, buf);
638 }
639
640 /*
641  * Crazy suunto xml. Look at how those o2/he things match up.
642  */
643 static int suunto_dive_match(struct dive *dive, const char *name, int len, char *buf)
644 {
645         return  MATCH(".o2pct", percent, &dive->cylinder[0].gasmix.o2) ||
646                 MATCH(".hepct_0", percent, &dive->cylinder[0].gasmix.he) ||
647                 MATCH(".o2pct_2", percent, &dive->cylinder[1].gasmix.o2) ||
648                 MATCH(".hepct_1", percent, &dive->cylinder[1].gasmix.he) ||
649                 MATCH(".o2pct_3", percent, &dive->cylinder[2].gasmix.o2) ||
650                 MATCH(".hepct_2", percent, &dive->cylinder[2].gasmix.he) ||
651                 MATCH(".o2pct_4", percent, &dive->cylinder[3].gasmix.o2) ||
652                 MATCH(".hepct_3", percent, &dive->cylinder[3].gasmix.he) ||
653                 MATCH(".cylindersize", cylindersize, &dive->cylinder[0].type.size) ||
654                 MATCH(".cylinderworkpressure", pressure, &dive->cylinder[0].type.workingpressure) ||
655                 0;
656 }
657
658 static const char *country, *city;
659
660 static void divinglog_place(char *place, void *_location)
661 {
662         char **location = _location;
663         char buffer[256], *p;
664         int len;
665
666         len = snprintf(buffer, sizeof(buffer),
667                 "%s%s%s%s%s",
668                 place,
669                 city ? ", " : "",
670                 city ? city : "",
671                 country ? ", " : "",
672                 country ? country : "");
673
674         p = malloc(len+1);
675         memcpy(p, buffer, len+1);
676         *location = p;
677
678         city = NULL;
679         country = NULL;
680 }
681
682 static int divinglog_dive_match(struct dive *dive, const char *name, int len, char *buf)
683 {
684         return  MATCH(".divedate", divedate, &dive->when) ||
685                 MATCH(".entrytime", divetime, &dive->when) ||
686                 MATCH(".depth", depth, &dive->maxdepth) ||
687                 MATCH(".tanksize", cylindersize, &dive->cylinder[0].type.size) ||
688                 MATCH(".presw", pressure, &dive->cylinder[0].type.workingpressure) ||
689                 MATCH(".comments", utf8_string, &dive->notes) ||
690                 MATCH(".buddy.names", utf8_string, &dive->buddy) ||
691                 MATCH(".country.name", utf8_string, &country) ||
692                 MATCH(".city.name", utf8_string, &city) ||
693                 MATCH(".place.name", divinglog_place, &dive->location) ||
694                 0;
695 }
696
697 static int buffer_value(char *buffer)
698 {
699         int val = atoi(buffer);
700         free(buffer);
701         return val;
702 }
703
704 static void uemis_length_unit(char *buffer, void *_unused)
705 {
706         input_units.length = buffer_value(buffer) ? FEET : METERS;
707 }
708
709 static void uemis_volume_unit(char *buffer, void *_unused)
710 {
711         input_units.volume = buffer_value(buffer) ? CUFT : LITER;
712 }
713
714 static void uemis_pressure_unit(char *buffer, void *_unused)
715 {
716 #if 0
717         input_units.pressure = buffer_value(buffer) ? PSI : BAR;
718 #endif
719 }
720
721 static void uemis_temperature_unit(char *buffer, void *_unused)
722 {
723         input_units.temperature = buffer_value(buffer) ? FAHRENHEIT : CELSIUS;
724 }
725
726 static void uemis_weight_unit(char *buffer, void *_unused)
727 {
728         input_units.weight = buffer_value(buffer) ? LBS : KG;
729 }
730
731 static void uemis_time_unit(char *buffer, void *_unused)
732 {
733 }
734
735 static void uemis_date_unit(char *buffer, void *_unused)
736 {
737 }
738
739 /* Modified julian day, yay! */
740 static void uemis_date_time(char *buffer, void *_when)
741 {
742         time_t *when = _when;
743         union int_or_float val;
744
745         switch (integer_or_float(buffer, &val)) {
746         case FLOAT:
747                 *when = (val.fp - 40587) * 86400;
748                 break;
749         default:
750                 fprintf(stderr, "Strange julian date: %s", buffer);
751         }
752         free(buffer);
753 }
754
755 /*
756  * Uemis doesn't know time zones. You need to do them as
757  * minutes, not hours.
758  *
759  * But that's ok, we don't track timezones yet either. We
760  * just turn everything into "localtime expressed as UTC".
761  */
762 static void uemis_time_zone(char *buffer, void *_when)
763 {
764 #if 0 /* seems like this is only used to display it correctly
765        * the stored time appears to be UTC */
766
767         time_t *when = _when;
768         signed char tz = atoi(buffer);
769
770         *when += tz * 3600;
771 #endif
772 }
773
774 /* 0 - air ; 1 - nitrox1 ; 2 - nitrox2 ; 3 = nitrox3 */
775 static int uemis_gas_template;
776
777 /*
778  * Christ. Uemis tank data is a total mess.
779  *
780  * We're passed a "virtual cylinder" (0 - 6) for the different
781  * Uemis tank cases ("air", "nitrox_1", "nitrox_2.{bottom,deco}"
782  * and "nitrox_3.{bottom,deco,travel}". We need to turn that
783  * into the actual cylinder data depending on the gas template,
784  * and ignore the ones that are irrelevant for that template.
785  *
786  * So for "template 2" (nitrox_2), we ignore virtual tanks 0-1
787  * (which are "air" and "nitrox_1" respectively), and tanks 4-6
788  * (which are the three "nitrox_3" tanks), and we turn virtual
789  * tanks 2/3 into actual tanks 0/1.
790  *
791  * Confused yet?
792  */
793 static int uemis_cylinder_index(void *_cylinder)
794 {
795         cylinder_t *cylinder = _cylinder;
796         unsigned int index = cylinder - dive->cylinder;
797
798         if (index > 6) {
799                 fprintf(stderr, "Uemis cylinder pointer calculations broken\n");
800                 return -1;
801         }
802         switch(uemis_gas_template) {
803         case 1: /* Dive uses tank 1 */
804                 index -= 1;
805         /* Fallthrough */
806         case 0: /* Dive uses tank 0 */
807                 if (index)
808                         index = -1;
809                 break;
810         case 2: /* Dive uses tanks 2-3 */
811                 index -= 2;
812                 if (index > 1)
813                         index = -1;
814                 break;
815         case 3: /* Dive uses tanks 4-6 */
816                 index -= 4;
817                 if (index > 2)
818                         index = -1;
819                 break;
820         }
821         return index;
822 }
823
824 static void uemis_cylindersize(char *buffer, void *_cylinder)
825 {
826         int index = uemis_cylinder_index(_cylinder);
827         if (index >= 0)
828                 cylindersize(buffer, &dive->cylinder[index].type.size);
829 }
830
831 static void uemis_percent(char *buffer, void *_cylinder)
832 {
833         int index = uemis_cylinder_index(_cylinder);
834         if (index >= 0)
835                 percent(buffer, &dive->cylinder[index].gasmix.o2);
836 }
837
838 static int uemis_dive_match(struct dive *dive, const char *name, int len, char *buf)
839 {
840         return  MATCH(".units.length", uemis_length_unit, &input_units) ||
841                 MATCH(".units.volume", uemis_volume_unit, &input_units) ||
842                 MATCH(".units.pressure", uemis_pressure_unit, &input_units) ||
843                 MATCH(".units.temperature", uemis_temperature_unit, &input_units) ||
844                 MATCH(".units.weight", uemis_weight_unit, &input_units) ||
845                 MATCH(".units.time", uemis_time_unit, &input_units) ||
846                 MATCH(".units.date", uemis_date_unit, &input_units) ||
847                 MATCH(".date_time", uemis_date_time, &dive->when) ||
848                 MATCH(".time_zone", uemis_time_zone, &dive->when) ||
849                 MATCH(".ambient.temperature", decicelsius, &dive->airtemp) ||
850                 MATCH(".gas.template", get_index, &uemis_gas_template) ||
851                 MATCH(".air.bottom_tank.size", uemis_cylindersize, dive->cylinder + 0) ||
852                 MATCH(".air.bottom_tank.oxygen", uemis_percent, dive->cylinder + 0) ||
853                 MATCH(".nitrox_1.bottom_tank.size", uemis_cylindersize, dive->cylinder + 1) ||
854                 MATCH(".nitrox_1.bottom_tank.oxygen", uemis_percent, dive->cylinder + 1) ||
855                 MATCH(".nitrox_2.bottom_tank.size", uemis_cylindersize, dive->cylinder + 2) ||
856                 MATCH(".nitrox_2.bottom_tank.oxygen", uemis_percent, dive->cylinder + 2) ||
857                 MATCH(".nitrox_2.deco_tank.size", uemis_cylindersize, dive->cylinder + 3) ||
858                 MATCH(".nitrox_2.deco_tank.oxygen", uemis_percent, dive->cylinder + 3) ||
859                 MATCH(".nitrox_3.bottom_tank.size", uemis_cylindersize, dive->cylinder + 4) ||
860                 MATCH(".nitrox_3.bottom_tank.oxygen", uemis_percent, dive->cylinder + 4) ||
861                 MATCH(".nitrox_3.deco_tank.size", uemis_cylindersize, dive->cylinder + 5) ||
862                 MATCH(".nitrox_3.deco_tank.oxygen", uemis_percent, dive->cylinder + 5) ||
863                 MATCH(".nitrox_3.travel_tank.size", uemis_cylindersize, dive->cylinder + 6) ||
864                 MATCH(".nitrox_3.travel_tank.oxygen", uemis_percent, dive->cylinder + 6) ||
865                 MATCH(".dive.val.bin", uemis_parse_divelog_binary, &dive) ||
866                 0;
867 }
868
869 /*
870  * Uddf specifies ISO 8601 time format.
871  *
872  * There are many variations on that. This handles the useful cases.
873  */
874 static void uddf_datetime(char *buffer, void *_when)
875 {
876         char c;
877         int y,m,d,hh,mm,ss;
878         time_t *when = _when;
879         struct tm tm = { 0 };
880         int i;
881
882         i = sscanf(buffer, "%d-%d-%d%c%d:%d:%d", &y, &m, &d, &c, &hh, &mm, &ss);
883         if (i == 7)
884                 goto success;
885         ss = 0;
886         if (i == 6)
887                 goto success;
888
889         i = sscanf(buffer, "%04d%02d%02d%c%02d%02d%02d", &y, &m, &d, &c, &hh, &mm, &ss);
890         if (i == 7)
891                 goto success;
892         ss = 0;
893         if (i == 6)
894                 goto success;
895 bad_date:
896         printf("Bad date time %s\n", buffer);
897         free(buffer);
898         return;
899
900 success:
901         if (c != 'T' && c != ' ')
902                 goto bad_date;
903         tm.tm_year = y;
904         tm.tm_mon = m - 1;
905         tm.tm_mday = d;
906         tm.tm_hour = hh;
907         tm.tm_min = mm;
908         tm.tm_sec = ss;
909         *when = utc_mktime(&tm);
910         free(buffer);
911 }
912
913 static int uddf_dive_match(struct dive *dive, const char *name, int len, char *buf)
914 {
915         return  MATCH(".datetime", uddf_datetime, &dive->when) ||
916                 MATCH(".diveduration", duration, &dive->duration) ||
917                 MATCH(".greatestdepth", depth, &dive->maxdepth) ||
918                 0;
919 }
920
921 static void gps_location(char *buffer, void *_dive)
922 {
923         int i;
924         struct dive *dive = _dive;
925         double latitude, longitude;
926
927         i = sscanf(buffer, "%lf %lf", &latitude, &longitude);
928         if (i == 2) {
929                 dive->latitude = latitude;
930                 dive->longitude = longitude;
931         }
932         free(buffer);
933 }
934
935 /* We're in the top-level dive xml. Try to convert whatever value to a dive value */
936 static void try_to_fill_dive(struct dive *dive, const char *name, char *buf)
937 {
938         int len = strlen(name);
939
940         start_match("dive", name, buf);
941
942         switch (import_source) {
943         case SUUNTO:
944                 if (suunto_dive_match(dive, name, len, buf))
945                         return;
946                 break;
947
948         case UEMIS:
949                 if (uemis_dive_match(dive, name, len, buf))
950                         return;
951                 break;
952
953         case DIVINGLOG:
954                 if (divinglog_dive_match(dive, name, len, buf))
955                         return;
956                 break;
957
958         case UDDF:
959                 if (uddf_dive_match(dive, name, len, buf))
960                         return;
961                 break;
962
963         default:
964                 break;
965         }
966
967         if (MATCH(".number", get_index, &dive->number))
968                 return;
969         if (MATCH(".date", divedate, &dive->when))
970                 return;
971         if (MATCH(".time", divetime, &dive->when))
972                 return;
973         if (MATCH(".datetime", divedatetime, &dive->when))
974                 return;
975         if (MATCH(".maxdepth", depth, &dive->maxdepth))
976                 return;
977         if (MATCH(".meandepth", depth, &dive->meandepth))
978                 return;
979         if (MATCH(".depth.max", depth, &dive->maxdepth))
980                 return;
981         if (MATCH(".depth.mean", depth, &dive->meandepth))
982                 return;
983         if (MATCH(".duration", duration, &dive->duration))
984                 return;
985         if (MATCH(".divetime", duration, &dive->duration))
986                 return;
987         if (MATCH(".divetimesec", duration, &dive->duration))
988                 return;
989         if (MATCH(".surfacetime", duration, &dive->surfacetime))
990                 return;
991         if (MATCH(".airtemp", temperature, &dive->airtemp))
992                 return;
993         if (MATCH(".watertemp", temperature, &dive->watertemp))
994                 return;
995         if (MATCH(".temperature.air", temperature, &dive->airtemp))
996                 return;
997         if (MATCH(".temperature.water", temperature, &dive->watertemp))
998                 return;
999         if (MATCH(".cylinderstartpressure", pressure, &dive->cylinder[0].start))
1000                 return;
1001         if (MATCH(".cylinderendpressure", pressure, &dive->cylinder[0].end))
1002                 return;
1003         if (MATCH(".gps", gps_location, dive))
1004                 return;
1005         if (MATCH(".location", utf8_string, &dive->location))
1006                 return;
1007         if (MATCH(".notes", utf8_string, &dive->notes))
1008                 return;
1009         if (MATCH(".divemaster", utf8_string, &dive->divemaster))
1010                 return;
1011         if (MATCH(".buddy", utf8_string, &dive->buddy))
1012                 return;
1013
1014         if (MATCH(".cylinder.size", cylindersize, &dive->cylinder[cylinder_index].type.size))
1015                 return;
1016         if (MATCH(".cylinder.workpressure", pressure, &dive->cylinder[cylinder_index].type.workingpressure))
1017                 return;
1018         if (MATCH(".cylinder.description", utf8_string, &dive->cylinder[cylinder_index].type.description))
1019                 return;
1020         if (MATCH(".cylinder.start", pressure, &dive->cylinder[cylinder_index].start))
1021                 return;
1022         if (MATCH(".cylinder.end", pressure, &dive->cylinder[cylinder_index].end))
1023                 return;
1024
1025         if (MATCH(".o2", gasmix, &dive->cylinder[cylinder_index].gasmix.o2))
1026                 return;
1027         if (MATCH(".n2", gasmix_nitrogen, &dive->cylinder[cylinder_index].gasmix))
1028                 return;
1029         if (MATCH(".he", gasmix, &dive->cylinder[cylinder_index].gasmix.he))
1030                 return;
1031
1032         nonmatch("dive", name, buf);
1033 }
1034
1035 /*
1036  * File boundaries are dive boundaries. But sometimes there are
1037  * multiple dives per file, so there can be other events too that
1038  * trigger a "new dive" marker and you may get some nesting due
1039  * to that. Just ignore nesting levels.
1040  */
1041 static void dive_start(void)
1042 {
1043         if (dive)
1044                 return;
1045         dive = alloc_dive();
1046         memset(&tm, 0, sizeof(tm));
1047 }
1048
1049 static void sanitize_gasmix(struct gasmix *mix)
1050 {
1051         unsigned int o2, he;
1052
1053         o2 = mix->o2.permille;
1054         he = mix->he.permille;
1055
1056         /* Regular air: leave empty */
1057         if (!he) {
1058                 if (!o2)
1059                         return;
1060                 /* 20.9% or 21% O2 is just air */
1061                 if (o2 >= 209 && o2 <= 210) {
1062                         mix->o2.permille = 0;
1063                         return;
1064                 }
1065         }
1066
1067         /* Sane mix? */
1068         if (o2 <= 1000 && he <= 1000 && o2+he <= 1000)
1069                 return;
1070         fprintf(stderr, "Odd gasmix: %d O2 %d He\n", o2, he);
1071         memset(mix, 0, sizeof(*mix));
1072 }
1073
1074 /*
1075  * See if the size/workingpressure looks like some standard cylinder
1076  * size, eg "AL80".
1077  */
1078 static void match_standard_cylinder(cylinder_type_t *type)
1079 {
1080         double cuft;
1081         int psi, len;
1082         const char *fmt;
1083         char buffer[20], *p;
1084
1085         /* Do we already have a cylinder description? */
1086         if (type->description)
1087                 return;
1088
1089         cuft = type->size.mliter / 28317.0;
1090         cuft *= to_ATM(type->workingpressure);
1091         psi = type->workingpressure.mbar / 68.95;
1092
1093         switch (psi) {
1094         case 2300 ... 2500:     /* 2400 psi: LP tank */
1095                 fmt = "LP%d";
1096                 break;
1097         case 2600 ... 2700:     /* 2640 psi: LP+10% */
1098                 fmt = "LP%d";
1099                 break;
1100         case 2900 ... 3100:     /* 3000 psi: ALx tank */
1101                 fmt = "AL%d";
1102                 break;
1103         case 3400 ... 3500:     /* 3442 psi: HP tank */
1104                 fmt = "HP%d";
1105                 break;
1106         case 3700 ... 3850:     /* HP+10% */
1107                 fmt = "HP%d+";
1108                 break;
1109         default:
1110                 return;
1111         }
1112         len = snprintf(buffer, sizeof(buffer), fmt, (int) (cuft+0.5));
1113         p = malloc(len+1);
1114         if (!p)
1115                 return;
1116         memcpy(p, buffer, len+1);
1117         type->description = p;
1118 }
1119
1120
1121 /*
1122  * There are two ways to give cylinder size information:
1123  *  - total amount of gas in cuft (depends on working pressure and physical size)
1124  *  - physical size
1125  *
1126  * where "physical size" is the one that actually matters and is sane.
1127  *
1128  * We internally use physical size only. But we save the workingpressure
1129  * so that we can do the conversion if required.
1130  */
1131 static void sanitize_cylinder_type(cylinder_type_t *type)
1132 {
1133         double volume_of_air, atm, volume;
1134
1135         /* If we have no working pressure, it had *better* be just a physical size! */
1136         if (!type->workingpressure.mbar)
1137                 return;
1138
1139         /* No size either? Nothing to go on */
1140         if (!type->size.mliter)
1141                 return;
1142
1143         if (input_units.volume == CUFT || import_source == SUUNTO) {
1144                 volume_of_air = type->size.mliter * 28.317;     /* milli-cu ft to milliliter */
1145                 atm = to_ATM(type->workingpressure);            /* working pressure in atm */
1146                 volume = volume_of_air / atm;                   /* milliliters at 1 atm: "true size" */
1147                 type->size.mliter = volume + 0.5;
1148         }
1149
1150         /* Ok, we have both size and pressure: try to match a description */
1151         match_standard_cylinder(type);
1152 }
1153
1154 static void sanitize_cylinder_info(struct dive *dive)
1155 {
1156         int i;
1157
1158         for (i = 0; i < MAX_CYLINDERS; i++) {
1159                 sanitize_gasmix(&dive->cylinder[i].gasmix);
1160                 sanitize_cylinder_type(&dive->cylinder[i].type);
1161         }
1162 }
1163
1164 static void dive_end(void)
1165 {
1166         if (!dive)
1167                 return;
1168         sanitize_cylinder_info(dive);
1169         record_dive(dive);
1170         dive = NULL;
1171         cylinder_index = 0;
1172 }
1173
1174 static void event_start(void)
1175 {
1176         memset(&event, 0, sizeof(event));
1177         event.active = 1;
1178 }
1179
1180 static void event_end(void)
1181 {
1182         if (event.name && strcmp(event.name, "surface") != 0)
1183                 add_event(dive, event.time.seconds, event.type, event.flags, event.value, event.name);
1184         event.active = 0;
1185 }
1186
1187 static void cylinder_start(void)
1188 {
1189 }
1190
1191 static void cylinder_end(void)
1192 {
1193         cylinder_index++;
1194 }
1195
1196 static void sample_start(void)
1197 {
1198         sample = prepare_sample(&dive);
1199 }
1200
1201 static void sample_end(void)
1202 {
1203         if (!dive)
1204                 return;
1205
1206         finish_sample(dive, sample);
1207         sample = NULL;
1208 }
1209
1210 static void entry(const char *name, int size, const char *raw)
1211 {
1212         char *buf = malloc(size+1);
1213
1214         if (!buf)
1215                 return;
1216         memcpy(buf, raw, size);
1217         buf[size] = 0;
1218         if (event.active) {
1219                 try_to_fill_event(name, buf);
1220                 return;
1221         }
1222         if (sample) {
1223                 try_to_fill_sample(sample, name, buf);
1224                 return;
1225         }
1226         if (dive) {
1227                 try_to_fill_dive(dive, name, buf);
1228                 return;
1229         }
1230 }
1231
1232 static const char *nodename(xmlNode *node, char *buf, int len)
1233 {
1234         if (!node || !node->name)
1235                 return "root";
1236
1237         buf += len;
1238         *--buf = 0;
1239         len--;
1240
1241         for(;;) {
1242                 const char *name = node->name;
1243                 int i = strlen(name);
1244                 while (--i >= 0) {
1245                         unsigned char c = name[i];
1246                         *--buf = tolower(c);
1247                         if (!--len)
1248                                 return buf;
1249                 }
1250                 node = node->parent;
1251                 if (!node || !node->name)
1252                         return buf;
1253                 *--buf = '.';
1254                 if (!--len)
1255                         return buf;
1256         }
1257 }
1258
1259 #define MAXNAME 64
1260
1261 static void visit_one_node(xmlNode *node)
1262 {
1263         int len;
1264         const unsigned char *content;
1265         char buffer[MAXNAME];
1266         const char *name;
1267
1268         content = node->content;
1269         if (!content)
1270                 return;
1271
1272         /* Trim whitespace at beginning */
1273         while (isspace(*content))
1274                 content++;
1275
1276         /* Trim whitespace at end */
1277         len = strlen(content);
1278         while (len && isspace(content[len-1]))
1279                 len--;
1280
1281         if (!len)
1282                 return;
1283
1284         /* Don't print out the node name if it is "text" */
1285         if (!strcmp(node->name, "text"))
1286                 node = node->parent;
1287
1288         name = nodename(node, buffer, sizeof(buffer));
1289
1290         entry(name, len, content);
1291 }
1292
1293 static void traverse(xmlNode *root);
1294
1295 static void traverse_properties(xmlNode *node)
1296 {
1297         xmlAttr *p;
1298
1299         for (p = node->properties; p; p = p->next)
1300                 traverse(p->children);
1301 }
1302
1303 static void visit(xmlNode *n)
1304 {
1305         visit_one_node(n);
1306         traverse_properties(n);
1307         traverse(n->children);
1308 }
1309
1310 static void suunto_importer(void)
1311 {
1312         import_source = SUUNTO;
1313         input_units = SI_units;
1314 }
1315
1316 static void uemis_importer(void)
1317 {
1318         import_source = UEMIS;
1319         input_units = SI_units;
1320 }
1321
1322 static void DivingLog_importer(void)
1323 {
1324         import_source = DIVINGLOG;
1325
1326         /*
1327          * Diving Log units are really strange.
1328          *
1329          * Temperatures are in C, except in samples,
1330          * when they are in Fahrenheit. Depths are in
1331          * meters, an dpressure is in PSI in the samples,
1332          * but in bar when it comes to working pressure.
1333          *
1334          * Crazy f*%^ morons.
1335          */
1336         input_units = SI_units;
1337 }
1338
1339 static void uddf_importer(void)
1340 {
1341         import_source = UDDF;
1342         input_units = SI_units;
1343         input_units.pressure = PASCAL;
1344         input_units.temperature = KELVIN;
1345 }
1346
1347 /*
1348  * I'm sure this could be done as some fancy DTD rules.
1349  * It's just not worth the headache.
1350  */
1351 static struct nesting {
1352         const char *name;
1353         void (*start)(void), (*end)(void);
1354 } nesting[] = {
1355         { "dive", dive_start, dive_end },
1356         { "Dive", dive_start, dive_end },
1357         { "sample", sample_start, sample_end },
1358         { "waypoint", sample_start, sample_end },
1359         { "SAMPLE", sample_start, sample_end },
1360         { "reading", sample_start, sample_end },
1361         { "event", event_start, event_end },
1362         { "gasmix", cylinder_start, cylinder_end },
1363         { "cylinder", cylinder_start, cylinder_end },
1364         { "P", sample_start, sample_end },
1365
1366         /* Import type recognition */
1367         { "SUUNTO", suunto_importer },
1368         { "Divinglog", DivingLog_importer },
1369         { "pre_dive", uemis_importer },
1370         { "dives", uemis_importer },
1371         { "uddf", uddf_importer },
1372
1373         { NULL, }
1374 };
1375
1376 static void traverse(xmlNode *root)
1377 {
1378         xmlNode *n;
1379
1380         for (n = root; n; n = n->next) {
1381                 struct nesting *rule = nesting;
1382
1383                 do {
1384                         if (!strcmp(rule->name, n->name))
1385                                 break;
1386                         rule++;
1387                 } while (rule->name);
1388
1389                 if (rule->start)
1390                         rule->start();
1391                 visit(n);
1392                 if (rule->end)
1393                         rule->end();
1394         }
1395 }
1396
1397 /* Per-file reset */
1398 static void reset_all(void)
1399 {
1400         /*
1401          * We reset the units for each file. You'd think it was
1402          * a per-dive property, but I'm not going to trust people
1403          * to do per-dive setup. If the xml does have per-dive
1404          * data within one file, we might have to reset it per
1405          * dive for that format.
1406          */
1407         input_units = SI_units;
1408         import_source = UNKNOWN;
1409 }
1410
1411 void parse_xml_file(const char *filename, GError **error)
1412 {
1413         xmlDoc *doc;
1414
1415         doc = xmlReadFile(filename, NULL, 0);
1416         if (!doc) {
1417                 fprintf(stderr, "Failed to parse '%s'.\n", filename);
1418                 if (error != NULL)
1419                 {
1420                         *error = g_error_new(g_quark_from_string("subsurface"),
1421                                              DIVE_ERROR_PARSE,
1422                                              "Failed to parse '%s'",
1423                                              filename);
1424                 }
1425                 return;
1426         }
1427         /* we assume that the last (or only) filename passed as argument is a 
1428          * great filename to use as default when saving the dives */ 
1429         set_filename(filename);
1430         reset_all();
1431         dive_start();
1432         traverse(xmlDocGetRootElement(doc));
1433         dive_end();
1434         xmlFreeDoc(doc);
1435         xmlCleanupParser();
1436 }
1437
1438 void parse_xml_init(void)
1439 {
1440         LIBXML_TEST_VERSION
1441 }